计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2011年
24期
129-131
,共3页
粗糙集%属性约简%文本分类
粗糙集%屬性約簡%文本分類
조조집%속성약간%문본분류
自动文本分类的效果在很大程度上依赖于属性特征的选择.针对传统基于频率阈值过滤的特征选择方法会导致有效信息丢失,影响分类精度的不足,提出了一种基于粗糙集的文本自动分类算法.该方法对加权后的特征属性进行离散化,建立一个决策表;根据基于依赖度的属性重要度对决策表中条件属性进行适当的筛选;采用基于条件信息熵的启发式算法实现文本属性特征的约简.实验结果表明,该方法能约简大量冗余的特征属性,在不降低分类精度的同时,提高文本分类的运行效率.
自動文本分類的效果在很大程度上依賴于屬性特徵的選擇.針對傳統基于頻率閾值過濾的特徵選擇方法會導緻有效信息丟失,影響分類精度的不足,提齣瞭一種基于粗糙集的文本自動分類算法.該方法對加權後的特徵屬性進行離散化,建立一箇決策錶;根據基于依賴度的屬性重要度對決策錶中條件屬性進行適噹的篩選;採用基于條件信息熵的啟髮式算法實現文本屬性特徵的約簡.實驗結果錶明,該方法能約簡大量冗餘的特徵屬性,在不降低分類精度的同時,提高文本分類的運行效率.
자동문본분류적효과재흔대정도상의뢰우속성특정적선택.침대전통기우빈솔역치과려적특정선택방법회도치유효신식주실,영향분류정도적불족,제출료일충기우조조집적문본자동분류산법.해방법대가권후적특정속성진행리산화,건립일개결책표;근거기우의뢰도적속성중요도대결책표중조건속성진행괄당적사선;채용기우조건신식적적계발식산법실현문본속성특정적약간.실험결과표명,해방법능약간대량용여적특정속성,재불강저분류정도적동시,제고문본분류적운행효솔.