山东大学学报(理学版)
山東大學學報(理學版)
산동대학학보(이학판)
JOURNAL OF SHANDONG UNIVERSITY(NATURAL SCIENCE)
2007年
11期
66-68,72
,共4页
文本分类%RIPPER%hRIPPER%层次特征选择%噪音特征项%过滤
文本分類%RIPPER%hRIPPER%層次特徵選擇%譟音特徵項%過濾
문본분류%RIPPER%hRIPPER%층차특정선택%조음특정항%과려
基于规则学习的文本分类算法RIPPER具有易理解、易优化、高效率等特点,但是当规则所涉及的特征项很多的时候,上述优点不复存在.基于层次的规则学习算法hRIPPER采用了层次架构对RIPPER进行了改进,但其对特征项的过滤仍然有限.针对RIPPER,hRIPPER在规则学习过程中出现的问题,对规则学习的分类算法进行改进,提出了一种改进的基于规则学习的文本分类算法iRIPPER,在规则学习的同时进一步过滤噪音特征项.实验证明,该方法不但有效地提取了特征项,生成较少的规则,提高了算法的准确率和召回率,而且缩短了生成规则的时间,从而改进了规则学习分类算法的性能.
基于規則學習的文本分類算法RIPPER具有易理解、易優化、高效率等特點,但是噹規則所涉及的特徵項很多的時候,上述優點不複存在.基于層次的規則學習算法hRIPPER採用瞭層次架構對RIPPER進行瞭改進,但其對特徵項的過濾仍然有限.針對RIPPER,hRIPPER在規則學習過程中齣現的問題,對規則學習的分類算法進行改進,提齣瞭一種改進的基于規則學習的文本分類算法iRIPPER,在規則學習的同時進一步過濾譟音特徵項.實驗證明,該方法不但有效地提取瞭特徵項,生成較少的規則,提高瞭算法的準確率和召迴率,而且縮短瞭生成規則的時間,從而改進瞭規則學習分類算法的性能.
기우규칙학습적문본분류산법RIPPER구유역리해、역우화、고효솔등특점,단시당규칙소섭급적특정항흔다적시후,상술우점불복존재.기우층차적규칙학습산법hRIPPER채용료층차가구대RIPPER진행료개진,단기대특정항적과려잉연유한.침대RIPPER,hRIPPER재규칙학습과정중출현적문제,대규칙학습적분류산법진행개진,제출료일충개진적기우규칙학습적문본분류산법iRIPPER,재규칙학습적동시진일보과려조음특정항.실험증명,해방법불단유효지제취료특정항,생성교소적규칙,제고료산법적준학솔화소회솔,이차축단료생성규칙적시간,종이개진료규칙학습분류산법적성능.