科技通报
科技通報
과기통보
BULLETIN OF SCIENCE AND TECHNOLOGY
2013年
10期
202-204
,共3页
web数据%距离%信息熵
web數據%距離%信息熵
web수거%거리%신식적
web data%distance%the information entropy
Web信息复杂程度不断加深,多维度、高复杂度的信息越来越多,信息中的错误信息特征在海量复杂数据属性中表述越来越困难,造成信息挖掘耗时过长,挖掘效果不好的问题。为了解决这一问题,提出了一种距离信息模糊信息权值分类的Web错误数据挖掘算法。在Web特征表述过程中,运用距离描述Web数据的错误数据特征,运用模糊信息熵,对错误数据特征进行距离分类,保证数据分类的准确性,最大程度的完成错误数据高效挖掘。实验结果表明,该算法能有效减少错误数据信息在海量信息中的挖掘时间,提高了挖掘的准确性,取得了满意的效果。
Web信息複雜程度不斷加深,多維度、高複雜度的信息越來越多,信息中的錯誤信息特徵在海量複雜數據屬性中錶述越來越睏難,造成信息挖掘耗時過長,挖掘效果不好的問題。為瞭解決這一問題,提齣瞭一種距離信息模糊信息權值分類的Web錯誤數據挖掘算法。在Web特徵錶述過程中,運用距離描述Web數據的錯誤數據特徵,運用模糊信息熵,對錯誤數據特徵進行距離分類,保證數據分類的準確性,最大程度的完成錯誤數據高效挖掘。實驗結果錶明,該算法能有效減少錯誤數據信息在海量信息中的挖掘時間,提高瞭挖掘的準確性,取得瞭滿意的效果。
Web신식복잡정도불단가심,다유도、고복잡도적신식월래월다,신식중적착오신식특정재해량복잡수거속성중표술월래월곤난,조성신식알굴모시과장,알굴효과불호적문제。위료해결저일문제,제출료일충거리신식모호신식권치분류적Web착오수거알굴산법。재Web특정표술과정중,운용거리묘술Web수거적착오수거특정,운용모호신식적,대착오수거특정진행거리분류,보증수거분류적준학성,최대정도적완성착오수거고효알굴。실험결과표명,해산법능유효감소착오수거신식재해량신식중적알굴시간,제고료알굴적준학성,취득료만의적효과。
Web information complex degree deepening, multidimension degree, high complexity of information more and more, the information of the error information characteristics in a deluge of complex data attribute expression more and more difficult, cause information mining too time consuming and mining the result is bad problems. In order to solve this problem, this paper puts forward a kind of distance information, fuzzy information right value classification Web wrong data mining algorithm. In web features in the process of expression, using distance describe web data error data charac-teristics, the use of fuzzy information entropy, the wrong data features of distance classification, guarantee the accuracy of the data classification, the greatest degree of finish wrong data high efficiency mining. The experimental results show that this algorithm can effectively reduce the error data information in the mass information mining time and improve the ac-curacy of the mining, and satisfactory effect is achieved.