中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2007年
5期
56-60
,共5页
计算机应用%中文信息处理%条件独立性假设%最小冗余原则%特征选取%文本分类
計算機應用%中文信息處理%條件獨立性假設%最小冗餘原則%特徵選取%文本分類
계산궤응용%중문신식처리%조건독립성가설%최소용여원칙%특정선취%문본분류
在文本分类中,为了降低计算复杂度,常用的特征选取方法(如IG)都假设特征之间条件独立.该假设将引入严重的特征冗余现象.为了降低特征子集的冗余度,本文提出了一种基于最小冗余原则(minimal Redundancy Principle, MRP)的特征选取方法.通过考虑不同特征之间的相关性,选择较小冗余度的特征子集.实验结果显示基于最小冗余原则方法能够改善特征选取的效果,提高文本分类的性能.
在文本分類中,為瞭降低計算複雜度,常用的特徵選取方法(如IG)都假設特徵之間條件獨立.該假設將引入嚴重的特徵冗餘現象.為瞭降低特徵子集的冗餘度,本文提齣瞭一種基于最小冗餘原則(minimal Redundancy Principle, MRP)的特徵選取方法.通過攷慮不同特徵之間的相關性,選擇較小冗餘度的特徵子集.實驗結果顯示基于最小冗餘原則方法能夠改善特徵選取的效果,提高文本分類的性能.
재문본분류중,위료강저계산복잡도,상용적특정선취방법(여IG)도가설특정지간조건독립.해가설장인입엄중적특정용여현상.위료강저특정자집적용여도,본문제출료일충기우최소용여원칙(minimal Redundancy Principle, MRP)적특정선취방법.통과고필불동특정지간적상관성,선택교소용여도적특정자집.실험결과현시기우최소용여원칙방법능구개선특정선취적효과,제고문본분류적성능.