计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2012年
11期
2359-2367
,共9页
Web论坛%论坛文档摘要%主题建模%Gibbs EM采样%文档摘要
Web論罈%論罈文檔摘要%主題建模%Gibbs EM採樣%文檔摘要
Web론단%론단문당적요%주제건모%Gibbs EM채양%문당적요
针对论坛文档由于自身特点缺乏有效的文档摘要方法的现状,提出一种基于LDA主题模型的论坛文档摘要方法.在主题建模中考虑了Web论坛文档中帖子和帖子之间的回复关系,并把主题的分布变为随文档变化而变化的一个动态过程,来解决主题的依赖和偏移问题.在使用Gibbs EM采样算法来确定动态主题模型的参数后,通过计算句子中主题权重之和来确定各个主题的重要程度;最后根据动态主题模型中主题的概率分布计算各句子的权重并得到文档的摘要.实验结果表明,新方法在各个ROUGE评测标准上均优于其他各种对比的摘要方法.
針對論罈文檔由于自身特點缺乏有效的文檔摘要方法的現狀,提齣一種基于LDA主題模型的論罈文檔摘要方法.在主題建模中攷慮瞭Web論罈文檔中帖子和帖子之間的迴複關繫,併把主題的分佈變為隨文檔變化而變化的一箇動態過程,來解決主題的依賴和偏移問題.在使用Gibbs EM採樣算法來確定動態主題模型的參數後,通過計算句子中主題權重之和來確定各箇主題的重要程度;最後根據動態主題模型中主題的概率分佈計算各句子的權重併得到文檔的摘要.實驗結果錶明,新方法在各箇ROUGE評測標準上均優于其他各種對比的摘要方法.
침대론단문당유우자신특점결핍유효적문당적요방법적현상,제출일충기우LDA주제모형적론단문당적요방법.재주제건모중고필료Web론단문당중첩자화첩자지간적회복관계,병파주제적분포변위수문당변화이변화적일개동태과정,래해결주제적의뢰화편이문제.재사용Gibbs EM채양산법래학정동태주제모형적삼수후,통과계산구자중주제권중지화래학정각개주제적중요정도;최후근거동태주제모형중주제적개솔분포계산각구자적권중병득도문당적적요.실험결과표명,신방법재각개ROUGE평측표준상균우우기타각충대비적적요방법.