计算机仿真
計算機倣真
계산궤방진
COMPUTER SIMULATION
2008年
1期
96-99
,共4页
数据挖掘%关联规则%频繁模式增长%最大频繁项目集
數據挖掘%關聯規則%頻繁模式增長%最大頻繁項目集
수거알굴%관련규칙%빈번모식증장%최대빈번항목집
随着人们利用信息技术生产和搜集数据的能力的提高,数据资料的规模急速膨胀,从庞大的数据中提取有用的知识和信息是数据挖掘的主要任务,而关联规则的挖掘足数据挖掘领域中的一个重要分支.Fp-gmwth算法是目前最有效的关联规则频繁模式挖掘算法之一,然而,由于在挖掘的过程中需要递归的生成频繁模式树,直接把Fp-growth算法应用在文本中的算法效率并不高.针对文本数据的稀疏性,提出了一个基于频繁模式树即Fp-tree和支持度矩阵相结合的最大频繁项目集挖掘算法,缩小了搜索空间,提高了算法的效率.算法分析和实验表明,算法对稀疏型数据集和稠密型数据均适用.
隨著人們利用信息技術生產和搜集數據的能力的提高,數據資料的規模急速膨脹,從龐大的數據中提取有用的知識和信息是數據挖掘的主要任務,而關聯規則的挖掘足數據挖掘領域中的一箇重要分支.Fp-gmwth算法是目前最有效的關聯規則頻繁模式挖掘算法之一,然而,由于在挖掘的過程中需要遞歸的生成頻繁模式樹,直接把Fp-growth算法應用在文本中的算法效率併不高.針對文本數據的稀疏性,提齣瞭一箇基于頻繁模式樹即Fp-tree和支持度矩陣相結閤的最大頻繁項目集挖掘算法,縮小瞭搜索空間,提高瞭算法的效率.算法分析和實驗錶明,算法對稀疏型數據集和稠密型數據均適用.
수착인문이용신식기술생산화수집수거적능력적제고,수거자료적규모급속팽창,종방대적수거중제취유용적지식화신식시수거알굴적주요임무,이관련규칙적알굴족수거알굴영역중적일개중요분지.Fp-gmwth산법시목전최유효적관련규칙빈번모식알굴산법지일,연이,유우재알굴적과정중수요체귀적생성빈번모식수,직접파Fp-growth산법응용재문본중적산법효솔병불고.침대문본수거적희소성,제출료일개기우빈번모식수즉Fp-tree화지지도구진상결합적최대빈번항목집알굴산법,축소료수색공간,제고료산법적효솔.산법분석화실험표명,산법대희소형수거집화주밀형수거균괄용.