计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2015年
7期
36-42
,共7页
彭敏%高斌龙%黄济民%刘纪平
彭敏%高斌龍%黃濟民%劉紀平
팽민%고빈룡%황제민%류기평
微博自动摘要%冗余去除%信息提取%自动评测%人工评测
微博自動摘要%冗餘去除%信息提取%自動評測%人工評測
미박자동적요%용여거제%신식제취%자동평측%인공평측
microblog automatic summarization%redundancy removal%information extraction%automatic evaluation%manual evaluation
文本自动摘要是获取微博平台关键信息的一种重要手段.现有面向微博的自动摘要方法较关注文本集合中句子或者关键词的提取,而在去除冗余信息、内容噪声方面缺乏有效手段,导致提取的微博内容质量不高.为解决该问题,以微博平台为研究对象,提出一种基于时频域转换的信息提取方法,获得与某话题相关度高、冗余度低且信息量大的高质量微博文本,将综合分值较高的微博作为生成摘要的样本集合,并对该样本集合中每条微博的句子进行权重打分,选取权值较高的句子组成微博摘要.实验结果表明,该方法能够有效过滤冗余信息和内容噪声,基于自动评测和人工评测的摘要结果均优于现有自动摘要方法.
文本自動摘要是穫取微博平檯關鍵信息的一種重要手段.現有麵嚮微博的自動摘要方法較關註文本集閤中句子或者關鍵詞的提取,而在去除冗餘信息、內容譟聲方麵缺乏有效手段,導緻提取的微博內容質量不高.為解決該問題,以微博平檯為研究對象,提齣一種基于時頻域轉換的信息提取方法,穫得與某話題相關度高、冗餘度低且信息量大的高質量微博文本,將綜閤分值較高的微博作為生成摘要的樣本集閤,併對該樣本集閤中每條微博的句子進行權重打分,選取權值較高的句子組成微博摘要.實驗結果錶明,該方法能夠有效過濾冗餘信息和內容譟聲,基于自動評測和人工評測的摘要結果均優于現有自動摘要方法.
문본자동적요시획취미박평태관건신식적일충중요수단.현유면향미박적자동적요방법교관주문본집합중구자혹자관건사적제취,이재거제용여신식、내용조성방면결핍유효수단,도치제취적미박내용질량불고.위해결해문제,이미박평태위연구대상,제출일충기우시빈역전환적신식제취방법,획득여모화제상관도고、용여도저차신식량대적고질량미박문본,장종합분치교고적미박작위생성적요적양본집합,병대해양본집합중매조미박적구자진행권중타분,선취권치교고적구자조성미박적요.실험결과표명,해방법능구유효과려용여신식화내용조성,기우자동평측화인공평측적적요결과균우우현유자동적요방법.