中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2012年
6期
79-84
,共6页
自动文摘%话题%自然语言处理%新闻
自動文摘%話題%自然語言處理%新聞
자동문적%화제%자연어언처리%신문
多文档文摘技术能帮助用户减少不必要的阅读时间,有广阔的应用前景.该文以新闻报道为处理对象,以MMR(Maximal Marginal Relevance)文摘提取算法为基础,针对目前新闻报道往往以专题形式组织展现的特点,提出了一种基于话题的多文档文摘方法.这种方法以话题关键字为打分依据,同时考虑句子位置特征等信息对句子的重要性进行评分.该文利用TDT4的新闻报道语料对上述文摘方法进行了试验评价,将基于话题的文摘系统和两个Baseline文摘系统进行比较,取得了较好的实验结果,尤其在5%的压缩比例下有明显优势.
多文檔文摘技術能幫助用戶減少不必要的閱讀時間,有廣闊的應用前景.該文以新聞報道為處理對象,以MMR(Maximal Marginal Relevance)文摘提取算法為基礎,針對目前新聞報道往往以專題形式組織展現的特點,提齣瞭一種基于話題的多文檔文摘方法.這種方法以話題關鍵字為打分依據,同時攷慮句子位置特徵等信息對句子的重要性進行評分.該文利用TDT4的新聞報道語料對上述文摘方法進行瞭試驗評價,將基于話題的文摘繫統和兩箇Baseline文摘繫統進行比較,取得瞭較好的實驗結果,尤其在5%的壓縮比例下有明顯優勢.
다문당문적기술능방조용호감소불필요적열독시간,유엄활적응용전경.해문이신문보도위처리대상,이MMR(Maximal Marginal Relevance)문적제취산법위기출,침대목전신문보도왕왕이전제형식조직전현적특점,제출료일충기우화제적다문당문적방법.저충방법이화제관건자위타분의거,동시고필구자위치특정등신식대구자적중요성진행평분.해문이용TDT4적신문보도어료대상술문적방법진행료시험평개,장기우화제적문적계통화량개Baseline문적계통진행비교,취득료교호적실험결과,우기재5%적압축비례하유명현우세.