计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2011年
13期
150-153
,共4页
文本分类%潜在狄利克雷分配(LDA)模型%Gibbs抽样%贝叶斯统计理论
文本分類%潛在狄利剋雷分配(LDA)模型%Gibbs抽樣%貝葉斯統計理論
문본분류%잠재적리극뢰분배(LDA)모형%Gibbs추양%패협사통계이론
针对传统的降维算法在处理高维和大规模的文本分类时存在的局限性,提出了一种基于LDA模型的文本分类算法,在判别模型SVM框架中,应用LDA概率增长模型,对文档集进行主题建模,在文档集的隐含主题-文本矩阵上训练SVM,构造文本分类器.参数推理采用Gibbs抽样,将每个文本表示为固定隐含主题集上的概率分布.应用贝叶斯统计理论中的标准方法,确定最优主题数T.在语料库上进行的分类实验表明,与文本表示采用VSM结合SVM,LSI结合SVM相比,具有较好的分类效果.
針對傳統的降維算法在處理高維和大規模的文本分類時存在的跼限性,提齣瞭一種基于LDA模型的文本分類算法,在判彆模型SVM框架中,應用LDA概率增長模型,對文檔集進行主題建模,在文檔集的隱含主題-文本矩陣上訓練SVM,構造文本分類器.參數推理採用Gibbs抽樣,將每箇文本錶示為固定隱含主題集上的概率分佈.應用貝葉斯統計理論中的標準方法,確定最優主題數T.在語料庫上進行的分類實驗錶明,與文本錶示採用VSM結閤SVM,LSI結閤SVM相比,具有較好的分類效果.
침대전통적강유산법재처리고유화대규모적문본분류시존재적국한성,제출료일충기우LDA모형적문본분류산법,재판별모형SVM광가중,응용LDA개솔증장모형,대문당집진행주제건모,재문당집적은함주제-문본구진상훈련SVM,구조문본분류기.삼수추리채용Gibbs추양,장매개문본표시위고정은함주제집상적개솔분포.응용패협사통계이론중적표준방법,학정최우주제수T.재어료고상진행적분류실험표명,여문본표시채용VSM결합SVM,LSI결합SVM상비,구유교호적분류효과.