计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2011年
16期
135-137
,共3页
特征选择%文本分类%互信息%粗糙集%属性约简
特徵選擇%文本分類%互信息%粗糙集%屬性約簡
특정선택%문본분류%호신식%조조집%속성약간
特征选择是文本分类的一个重要步骤.分析了互信息,针对其不足引进了粗糙集给出了一个基于关系积的属性约简算法,并以此为基础提出了一个新的适用于海量文本数据集的特征选择方法.该方法使互信息进行特征初选,利用基于关系积的属性约简算法消除冗余词.实验结果表明此种特征选择方法的微平均F<,1>和宏平均F<,1>较高.
特徵選擇是文本分類的一箇重要步驟.分析瞭互信息,針對其不足引進瞭粗糙集給齣瞭一箇基于關繫積的屬性約簡算法,併以此為基礎提齣瞭一箇新的適用于海量文本數據集的特徵選擇方法.該方法使互信息進行特徵初選,利用基于關繫積的屬性約簡算法消除冗餘詞.實驗結果錶明此種特徵選擇方法的微平均F<,1>和宏平均F<,1>較高.
특정선택시문본분류적일개중요보취.분석료호신식,침대기불족인진료조조집급출료일개기우관계적적속성약간산법,병이차위기출제출료일개신적괄용우해량문본수거집적특정선택방법.해방법사호신식진행특정초선,이용기우관계적적속성약간산법소제용여사.실험결과표명차충특정선택방법적미평균F<,1>화굉평균F<,1>교고.