中国科学技术大学学报
中國科學技術大學學報
중국과학기술대학학보
JOURNAL OF UNIVERSITY OF SCIENCE AND TECHNOLOGY OF CHINA
2009年
8期
875-879
,共5页
权小军%林洋港%罗奇鸣%陈恩红
權小軍%林洋港%囉奇鳴%陳恩紅
권소군%림양항%라기명%진은홍
层次分类%概率主题模型%Gibbs抽样
層次分類%概率主題模型%Gibbs抽樣
층차분류%개솔주제모형%Gibbs추양
hierarchical categorization%probabilistic topic model%Gibbs sampling
概率主题模型是一种统计生成模型,它从文档集合中抽取一系列主题,并将这些文档表示为不同主题依照一定概率混合而成.通过这种模型发现的主题,能揭示文档的语义信息,在很多领域都有着广泛的应用.为此基于概率主题模型,提出了一种新的层次文本分类方法. 该方法首先利用Gibbs抽样提取一系列主题,然后计算测试文档和每个类的基于主题的相似度.在20 NewsGroups数据集上的实验结果表明,该方法的分类性能明显超越支持向量机分类方法.
概率主題模型是一種統計生成模型,它從文檔集閤中抽取一繫列主題,併將這些文檔錶示為不同主題依照一定概率混閤而成.通過這種模型髮現的主題,能揭示文檔的語義信息,在很多領域都有著廣汎的應用.為此基于概率主題模型,提齣瞭一種新的層次文本分類方法. 該方法首先利用Gibbs抽樣提取一繫列主題,然後計算測試文檔和每箇類的基于主題的相似度.在20 NewsGroups數據集上的實驗結果錶明,該方法的分類性能明顯超越支持嚮量機分類方法.
개솔주제모형시일충통계생성모형,타종문당집합중추취일계렬주제,병장저사문당표시위불동주제의조일정개솔혼합이성.통과저충모형발현적주제,능게시문당적어의신식,재흔다영역도유착엄범적응용.위차기우개솔주제모형,제출료일충신적층차문본분류방법. 해방법수선이용Gibbs추양제취일계렬주제,연후계산측시문당화매개류적기우주제적상사도.재20 NewsGroups수거집상적실험결과표명,해방법적분류성능명현초월지지향량궤분류방법.
es.