计算机工程与科学
計算機工程與科學
계산궤공정여과학
COMPUTER ENGINEERING & SCIENCE
2012年
9期
174-179
,共6页
张素琪%梁志刚%胡利娟%董永峰
張素琪%樑誌剛%鬍利娟%董永峰
장소기%량지강%호리연%동영봉
关联规则%数据挖掘%Apriori算法%地址索引
關聯規則%數據挖掘%Apriori算法%地阯索引
관련규칙%수거알굴%Apriori산법%지지색인
关联规则是数据挖掘研究中最主要、最活跃的领域之一.以Apriori算法为前提,借助AprioriTid算法事务压缩的思想,减少了重复扫描数据库的时间;并提出了一种利用事务标识列表,该列表长度即是对应候选项集的支持度计数,在计算支持度计数时,仅需要得到对应列表长度即可,从而缩短了计算计数时的比较时间;同时,在生成频繁项集时引入地址索引机制,在剪枝过程中,利用候选项集的首元素在地址索引表中快速定位,减少了多次扫描事务数据库,有效地缩短了计数时间和占用的内存空间.利用改进的算法对科研管理系统数据进行关联关系分析,从中萃取数据中隐含的、有价值的信息,辅助下一阶段的科研管理工作.并通过试验进行性能比较得出,改进后的算法效率更高.
關聯規則是數據挖掘研究中最主要、最活躍的領域之一.以Apriori算法為前提,藉助AprioriTid算法事務壓縮的思想,減少瞭重複掃描數據庫的時間;併提齣瞭一種利用事務標識列錶,該列錶長度即是對應候選項集的支持度計數,在計算支持度計數時,僅需要得到對應列錶長度即可,從而縮短瞭計算計數時的比較時間;同時,在生成頻繁項集時引入地阯索引機製,在剪枝過程中,利用候選項集的首元素在地阯索引錶中快速定位,減少瞭多次掃描事務數據庫,有效地縮短瞭計數時間和佔用的內存空間.利用改進的算法對科研管理繫統數據進行關聯關繫分析,從中萃取數據中隱含的、有價值的信息,輔助下一階段的科研管理工作.併通過試驗進行性能比較得齣,改進後的算法效率更高.
관련규칙시수거알굴연구중최주요、최활약적영역지일.이Apriori산법위전제,차조AprioriTid산법사무압축적사상,감소료중복소묘수거고적시간;병제출료일충이용사무표식렬표,해렬표장도즉시대응후선항집적지지도계수,재계산지지도계수시,부수요득도대응렬표장도즉가,종이축단료계산계수시적비교시간;동시,재생성빈번항집시인입지지색인궤제,재전지과정중,이용후선항집적수원소재지지색인표중쾌속정위,감소료다차소묘사무수거고,유효지축단료계수시간화점용적내존공간.이용개진적산법대과연관리계통수거진행관련관계분석,종중췌취수거중은함적、유개치적신식,보조하일계단적과연관리공작.병통과시험진행성능비교득출,개진후적산법효솔경고.