计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2014年
z2期
298-300,332
,共4页
李然%张华平%赵燕平%商建云
李然%張華平%趙燕平%商建雲
리연%장화평%조연평%상건운
摘要%LDA模型%主题%信息熵
摘要%LDA模型%主題%信息熵
적요%LDA모형%주제%신식적
Summarization%LDA%Topic%Information entropy
提出了一种基于LDA模型以及信息熵的文档自动摘要技术,即通过LDA模型对文档进行浅层语义分析,得到文档的主题分布以及不同主题下的词语分布;通过对主题的分析,可以得到最能代表文档中心思想的主题,以及该主题下的词语分布.同时,提出了一种新的基于信息熵的度量句子重要性的方法,并将该方法应用于文档的关键句抽取过程中.该方法将文档中句子的出现看成一个随机变量,通过对随机变量建模并度量它的信息熵来选取文档中的关键性语句.实验结果表明,应用主题模型与信息熵摘取的文档摘要能有效地从文档中摘出中心句.
提齣瞭一種基于LDA模型以及信息熵的文檔自動摘要技術,即通過LDA模型對文檔進行淺層語義分析,得到文檔的主題分佈以及不同主題下的詞語分佈;通過對主題的分析,可以得到最能代錶文檔中心思想的主題,以及該主題下的詞語分佈.同時,提齣瞭一種新的基于信息熵的度量句子重要性的方法,併將該方法應用于文檔的關鍵句抽取過程中.該方法將文檔中句子的齣現看成一箇隨機變量,通過對隨機變量建模併度量它的信息熵來選取文檔中的關鍵性語句.實驗結果錶明,應用主題模型與信息熵摘取的文檔摘要能有效地從文檔中摘齣中心句.
제출료일충기우LDA모형이급신식적적문당자동적요기술,즉통과LDA모형대문당진행천층어의분석,득도문당적주제분포이급불동주제하적사어분포;통과대주제적분석,가이득도최능대표문당중심사상적주제,이급해주제하적사어분포.동시,제출료일충신적기우신식적적도량구자중요성적방법,병장해방법응용우문당적관건구추취과정중.해방법장문당중구자적출현간성일개수궤변량,통과대수궤변량건모병도량타적신식적래선취문당중적관건성어구.실험결과표명,응용주제모형여신식적적취적문당적요능유효지종문당중적출중심구.