计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2011年
12期
220-224,233
,共6页
王晓华%苏宏业%渠瑜%褚健
王曉華%囌宏業%渠瑜%褚健
왕효화%소굉업%거유%저건
电信%数据挖掘%欠费主题%数据质量评估%缺失%非平衡%离群度
電信%數據挖掘%欠費主題%數據質量評估%缺失%非平衡%離群度
전신%수거알굴%흠비주제%수거질량평고%결실%비평형%리군도
针对电信欠费挖掘主题,结合电信欠费数据非平衡的特点,重点研究了缺失与离群数据对分类结果的影响,从而提出了一个面向电信欠费挖掘的数据质量评估体系(TIM-DQAS):对于缺失评估,提出了一种基于类分布差异的属性加权算法,以衡量输入属性的缺失代价;对于离群评估,分析了非平衡数据中的离群点对分类结果的影响,提出离群度的概念,以量化离群点的影响.基于某城市电信小灵通数据的对比实验,给出了评估结果的参照值,验证了评估策略的有效性.
針對電信欠費挖掘主題,結閤電信欠費數據非平衡的特點,重點研究瞭缺失與離群數據對分類結果的影響,從而提齣瞭一箇麵嚮電信欠費挖掘的數據質量評估體繫(TIM-DQAS):對于缺失評估,提齣瞭一種基于類分佈差異的屬性加權算法,以衡量輸入屬性的缺失代價;對于離群評估,分析瞭非平衡數據中的離群點對分類結果的影響,提齣離群度的概唸,以量化離群點的影響.基于某城市電信小靈通數據的對比實驗,給齣瞭評估結果的參照值,驗證瞭評估策略的有效性.
침대전신흠비알굴주제,결합전신흠비수거비평형적특점,중점연구료결실여리군수거대분류결과적영향,종이제출료일개면향전신흠비알굴적수거질량평고체계(TIM-DQAS):대우결실평고,제출료일충기우류분포차이적속성가권산법,이형량수입속성적결실대개;대우리군평고,분석료비평형수거중적리군점대분류결과적영향,제출리군도적개념,이양화리군점적영향.기우모성시전신소령통수거적대비실험,급출료평고결과적삼조치,험증료평고책략적유효성.