中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2012年
1期
58-66
,共9页
韩永峰%许旭阳%李弼程%朱武斌%陈刚
韓永峰%許旭暘%李弼程%硃武斌%陳剛
한영봉%허욱양%리필정%주무빈%진강
事件抽取%中文信息处理%分类%新闻文档%聚类%自动摘要
事件抽取%中文信息處理%分類%新聞文檔%聚類%自動摘要
사건추취%중문신식처리%분류%신문문당%취류%자동적요
目前,有代表性的自动摘要方法是根据文本片段进行聚类,较传统方法避免了信息冗余,但网络新闻文本中有些文本片段和主题无关,影响了聚类的效果,导致最终生成的摘要不够简洁.为此,该文引入事件抽取技术,提出了一种基于事件抽取的网络新闻多文档自动摘要方法.该方法首先通过二元分类器辨析出文本中的事件和非事件;然后通过聚类将文档原来以段落或句子为单位的物理划分转化为以事件为单位的内容逻辑划分,最后通过主旨事件抽取、排序及润色,生成摘要.实验结果表明,该方法是有效的,显著提高了生成摘要的质量.
目前,有代錶性的自動摘要方法是根據文本片段進行聚類,較傳統方法避免瞭信息冗餘,但網絡新聞文本中有些文本片段和主題無關,影響瞭聚類的效果,導緻最終生成的摘要不夠簡潔.為此,該文引入事件抽取技術,提齣瞭一種基于事件抽取的網絡新聞多文檔自動摘要方法.該方法首先通過二元分類器辨析齣文本中的事件和非事件;然後通過聚類將文檔原來以段落或句子為單位的物理劃分轉化為以事件為單位的內容邏輯劃分,最後通過主旨事件抽取、排序及潤色,生成摘要.實驗結果錶明,該方法是有效的,顯著提高瞭生成摘要的質量.
목전,유대표성적자동적요방법시근거문본편단진행취류,교전통방법피면료신식용여,단망락신문문본중유사문본편단화주제무관,영향료취류적효과,도치최종생성적적요불구간길.위차,해문인입사건추취기술,제출료일충기우사건추취적망락신문다문당자동적요방법.해방법수선통과이원분류기변석출문본중적사건화비사건;연후통과취류장문당원래이단락혹구자위단위적물리화분전화위이사건위단위적내용라집화분,최후통과주지사건추취、배서급윤색,생성적요.실험결과표명,해방법시유효적,현저제고료생성적요적질량.