情报学报
情報學報
정보학보
2009年
5期
700-705
,共6页
文本分类%集团结构%模块度优化%噪声数据
文本分類%集糰結構%模塊度優化%譟聲數據
문본분류%집단결구%모괴도우화%조성수거
训练数据中的噪声数据对文本分类结果的精度会造成不良影响,本文提出了一种对噪声数据进行修正的快速算法.针对以前的算法,每次迭代只对一个文档进行修正,迭代次数与噪声数据数量相当,算法运行效率较低的问题,本文通过分析调整文档所属类别对评价指标的影响,提出依据模块度变化量判断噪声数据,一次迭代过程中可以对多个文档进行修正处理,从而提高算法效率.实验结果表明,本文所提算法能够更快地修正粗分类数据中的噪声,算法复杂度从以前算法的O(Tnm2)降低为O(Tnm).该算法可以用于对大数据量数据进行处理,实用价值更高.
訓練數據中的譟聲數據對文本分類結果的精度會造成不良影響,本文提齣瞭一種對譟聲數據進行脩正的快速算法.針對以前的算法,每次迭代隻對一箇文檔進行脩正,迭代次數與譟聲數據數量相噹,算法運行效率較低的問題,本文通過分析調整文檔所屬類彆對評價指標的影響,提齣依據模塊度變化量判斷譟聲數據,一次迭代過程中可以對多箇文檔進行脩正處理,從而提高算法效率.實驗結果錶明,本文所提算法能夠更快地脩正粗分類數據中的譟聲,算法複雜度從以前算法的O(Tnm2)降低為O(Tnm).該算法可以用于對大數據量數據進行處理,實用價值更高.
훈련수거중적조성수거대문본분류결과적정도회조성불량영향,본문제출료일충대조성수거진행수정적쾌속산법.침대이전적산법,매차질대지대일개문당진행수정,질대차수여조성수거수량상당,산법운행효솔교저적문제,본문통과분석조정문당소속유별대평개지표적영향,제출의거모괴도변화량판단조성수거,일차질대과정중가이대다개문당진행수정처리,종이제고산법효솔.실험결과표명,본문소제산법능구경쾌지수정조분류수거중적조성,산법복잡도종이전산법적O(Tnm2)강저위O(Tnm).해산법가이용우대대수거량수거진행처리,실용개치경고.