工业控制计算机
工業控製計算機
공업공제계산궤
INDUSTRY CONTROL COMPUTER
2012年
11期
89-90,92
,共3页
张振浩%周奇年%杨继慧%徐登彩
張振浩%週奇年%楊繼慧%徐登綵
장진호%주기년%양계혜%서등채
中文文本自动分类%特征选择%类别区分度%互信息%期望交叉熵
中文文本自動分類%特徵選擇%類彆區分度%互信息%期望交扠熵
중문문본자동분류%특정선택%유별구분도%호신식%기망교차적
特征选择是中文文本分类过程中的一个关键环节,文本特征项选择的优劣将直接影响文本分类的准确率.针对传统的特征选择算法没有考虑到特征项的类别区分度在特征选择中的作用而丧失了一些优秀的特征项的问题,文中通过引入特征项的类别区分度对传统的特征选择算法进行改进.实验结果表明,改进方法的分类效果要好于传统方法,从而验证了改进方法的有效性和可行性.
特徵選擇是中文文本分類過程中的一箇關鍵環節,文本特徵項選擇的優劣將直接影響文本分類的準確率.針對傳統的特徵選擇算法沒有攷慮到特徵項的類彆區分度在特徵選擇中的作用而喪失瞭一些優秀的特徵項的問題,文中通過引入特徵項的類彆區分度對傳統的特徵選擇算法進行改進.實驗結果錶明,改進方法的分類效果要好于傳統方法,從而驗證瞭改進方法的有效性和可行性.
특정선택시중문문본분류과정중적일개관건배절,문본특정항선택적우렬장직접영향문본분류적준학솔.침대전통적특정선택산법몰유고필도특정항적유별구분도재특정선택중적작용이상실료일사우수적특정항적문제,문중통과인입특정항적유별구분도대전통적특정선택산법진행개진.실험결과표명,개진방법적분류효과요호우전통방법,종이험증료개진방법적유효성화가행성.