计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2012年
7期
161-164,199
,共5页
不确定性数据%频繁项集%主成分分析%模糊关联
不確定性數據%頻繁項集%主成分分析%模糊關聯
불학정성수거%빈번항집%주성분분석%모호관련
传统频繁项集挖掘技术无法高效获取不确定性数据中有价值的信息.通过研究频繁模式增长树的算法原理,根据不确定性数据的特点提出了一种有效的不确定性数据预处理方法PCAFP-Growth.利用主成分分析的方法进行数据的降维,并使用模糊关联分析法将数据概率进行分类,实现数据剪枝.在理论研究基础上,通过实验对数据集进行了验证.结果表明,基于主成分分析法的剪枝策略在稠密数据集上能够有效提高运算速度,减少内存的使用.
傳統頻繁項集挖掘技術無法高效穫取不確定性數據中有價值的信息.通過研究頻繁模式增長樹的算法原理,根據不確定性數據的特點提齣瞭一種有效的不確定性數據預處理方法PCAFP-Growth.利用主成分分析的方法進行數據的降維,併使用模糊關聯分析法將數據概率進行分類,實現數據剪枝.在理論研究基礎上,通過實驗對數據集進行瞭驗證.結果錶明,基于主成分分析法的剪枝策略在稠密數據集上能夠有效提高運算速度,減少內存的使用.
전통빈번항집알굴기술무법고효획취불학정성수거중유개치적신식.통과연구빈번모식증장수적산법원리,근거불학정성수거적특점제출료일충유효적불학정성수거예처리방법PCAFP-Growth.이용주성분분석적방법진행수거적강유,병사용모호관련분석법장수거개솔진행분류,실현수거전지.재이론연구기출상,통과실험대수거집진행료험증.결과표명,기우주성분분석법적전지책략재주밀수거집상능구유효제고운산속도,감소내존적사용.