中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2008年
6期
50-54
,共5页
马亮%何婷婷%李芳%陈劲光%邵伟
馬亮%何婷婷%李芳%陳勁光%邵偉
마량%하정정%리방%진경광%소위
计算机应用%中文信息处理%多文档文摘%关键词抽取%文摘句选择
計算機應用%中文信息處理%多文檔文摘%關鍵詞抽取%文摘句選擇
계산궤응용%중문신식처리%다문당문적%관건사추취%문적구선택
针对面向查询的多文档自动文摘,该文提出了一种以关键词抽取为核心的文摘句选择策略.通过查询扩展的相关技术得到相关多文档集中词语的查询相关性特征,利用最大似然估计法得到语料中词语的话题相关性特征,并将这两个特征值进行特征融合得到词语的重要度以确定关键词.然后通过关键词的重要度来给候选句打分,进一步利用改进的MMR(Maximal Marginal Relevance)技术来调整候选句的得分,最后生成文摘.该文将特征融合引入到词语层面,在DUC2005的语料中测试取得了较好的效果.
針對麵嚮查詢的多文檔自動文摘,該文提齣瞭一種以關鍵詞抽取為覈心的文摘句選擇策略.通過查詢擴展的相關技術得到相關多文檔集中詞語的查詢相關性特徵,利用最大似然估計法得到語料中詞語的話題相關性特徵,併將這兩箇特徵值進行特徵融閤得到詞語的重要度以確定關鍵詞.然後通過關鍵詞的重要度來給候選句打分,進一步利用改進的MMR(Maximal Marginal Relevance)技術來調整候選句的得分,最後生成文摘.該文將特徵融閤引入到詞語層麵,在DUC2005的語料中測試取得瞭較好的效果.
침대면향사순적다문당자동문적,해문제출료일충이관건사추취위핵심적문적구선택책략.통과사순확전적상관기술득도상관다문당집중사어적사순상관성특정,이용최대사연고계법득도어료중사어적화제상관성특정,병장저량개특정치진행특정융합득도사어적중요도이학정관건사.연후통과관건사적중요도래급후선구타분,진일보이용개진적MMR(Maximal Marginal Relevance)기술래조정후선구적득분,최후생성문적.해문장특정융합인입도사어층면,재DUC2005적어료중측시취득료교호적효과.