广西师范大学学报(自然科学版)
廣西師範大學學報(自然科學版)
엄서사범대학학보(자연과학판)
JOURNAL OF GUANGXI NORMAL UNIVERSITY(NATURAL SCIENCE EDITION)
2013年
3期
87-93
,共7页
杨文%李文敬%李双%李书举%林中明
楊文%李文敬%李雙%李書舉%林中明
양문%리문경%리쌍%리서거%림중명
分类压缩%粒度分析%GEP%并行算法
分類壓縮%粒度分析%GEP%併行算法
분류압축%립도분석%GEP%병행산법
classification compression%granular analysis%GEP%parallel algorithm
针对数据挖掘中流数据分类精度不高,数据压缩率低的问题,提出一种基于粒度分析与转存式GEP的流数据分类压缩并行算法,实现流数据的快速并行分类压缩.首先使用粒度分析技术对流数据的属性求得极小粒度集,根据划分规则得到近似粒度空间,然后根据不同类型流数据建立不同的GEP分类器模型,最后采用动态转存记录集形式,将数据送至GEP压缩模型实施压缩.再将串行算法扩展到MPI+OpenMP混合编程模型后得到其并行算法,采用UCI数据、通讯账单验证算法的性能.实验结果表明,分类压缩效果耗时较理想,压缩比效果明显,其中在校学生通讯账单耗时在96 s左右,压缩比达到1/3.
針對數據挖掘中流數據分類精度不高,數據壓縮率低的問題,提齣一種基于粒度分析與轉存式GEP的流數據分類壓縮併行算法,實現流數據的快速併行分類壓縮.首先使用粒度分析技術對流數據的屬性求得極小粒度集,根據劃分規則得到近似粒度空間,然後根據不同類型流數據建立不同的GEP分類器模型,最後採用動態轉存記錄集形式,將數據送至GEP壓縮模型實施壓縮.再將串行算法擴展到MPI+OpenMP混閤編程模型後得到其併行算法,採用UCI數據、通訊賬單驗證算法的性能.實驗結果錶明,分類壓縮效果耗時較理想,壓縮比效果明顯,其中在校學生通訊賬單耗時在96 s左右,壓縮比達到1/3.
침대수거알굴중류수거분류정도불고,수거압축솔저적문제,제출일충기우립도분석여전존식GEP적류수거분류압축병행산법,실현류수거적쾌속병행분류압축.수선사용립도분석기술대류수거적속성구득겁소립도집,근거화분규칙득도근사립도공간,연후근거불동류형류수거건립불동적GEP분류기모형,최후채용동태전존기록집형식,장수거송지GEP압축모형실시압축.재장천행산법확전도MPI+OpenMP혼합편정모형후득도기병행산법,채용UCI수거、통신장단험증산법적성능.실험결과표명,분류압축효과모시교이상,압축비효과명현,기중재교학생통신장단모시재96 s좌우,압축비체도1/3.