石家庄铁道大学学报(自然科学版)
石傢莊鐵道大學學報(自然科學版)
석가장철도대학학보(자연과학판)
JOURAL OF SHIJIAZHUANG TIEDAO UNIVERSITY(NATURAL SCIENCE EDITION)
2013年
1期
101-105,110
,共6页
文本分类%隐马尔科夫模型%信息增益%x2检验%泊松分布
文本分類%隱馬爾科伕模型%信息增益%x2檢驗%泊鬆分佈
문본분류%은마이과부모형%신식증익%x2검험%박송분포
文本分类经过多年的发展,已经产生了很多成熟高效的算法.将隐马尔科夫模型用于文本分类,对每个文本类构建一个隐马尔科夫模型,x2检验获得类别特征词集,其状态转移表示按照一指定顺序对类别特征词集进行遍历,状态输出符号为特征词的词频,隐马尔科夫模型的状态转移过程隐含的表示了属于该类的文本的形成过程.具有最大概率的HMM分类器就是所属的类别.该算法不仅将特征词考虑进去,而且还将词频信息融入隐马尔科夫模型中,实验结果表明该方法分类效率较高
文本分類經過多年的髮展,已經產生瞭很多成熟高效的算法.將隱馬爾科伕模型用于文本分類,對每箇文本類構建一箇隱馬爾科伕模型,x2檢驗穫得類彆特徵詞集,其狀態轉移錶示按照一指定順序對類彆特徵詞集進行遍歷,狀態輸齣符號為特徵詞的詞頻,隱馬爾科伕模型的狀態轉移過程隱含的錶示瞭屬于該類的文本的形成過程.具有最大概率的HMM分類器就是所屬的類彆.該算法不僅將特徵詞攷慮進去,而且還將詞頻信息融入隱馬爾科伕模型中,實驗結果錶明該方法分類效率較高
문본분류경과다년적발전,이경산생료흔다성숙고효적산법.장은마이과부모형용우문본분류,대매개문본류구건일개은마이과부모형,x2검험획득유별특정사집,기상태전이표시안조일지정순서대유별특정사집진행편력,상태수출부호위특정사적사빈,은마이과부모형적상태전이과정은함적표시료속우해류적문본적형성과정.구유최대개솔적HMM분류기취시소속적유별.해산법불부장특정사고필진거,이차환장사빈신식융입은마이과부모형중,실험결과표명해방법분류효솔교고