中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2011年
1期
104-109
,共6页
文档自动摘要%Blog%评论%HITS
文檔自動摘要%Blog%評論%HITS
문당자동적요%Blog%평론%HITS
Blog文章对应了大量评论信息,评论中又包含大量的噪声,因此如何结合Blog评论获取Blog文章的主要内容是许多基于Blog的应用所要面临的难题.以往提出的文摘方法大多是针对多文档文摘的通用方法,并未考虑Blog文章的特殊性,无法有效地结合评论来处理文章.该文通过分析Blog的特点提出了一种新的结合评论信息的Blog文摘方法.该方法首先基于特征计算出评论的权重,然后结合图模型使用HITS算法得到正文句子权重,进而得到文摘句.通过在凤凰博客数据集上的实验表明,该文方法在ROUGE测度上优于以往方法.
Blog文章對應瞭大量評論信息,評論中又包含大量的譟聲,因此如何結閤Blog評論穫取Blog文章的主要內容是許多基于Blog的應用所要麵臨的難題.以往提齣的文摘方法大多是針對多文檔文摘的通用方法,併未攷慮Blog文章的特殊性,無法有效地結閤評論來處理文章.該文通過分析Blog的特點提齣瞭一種新的結閤評論信息的Blog文摘方法.該方法首先基于特徵計算齣評論的權重,然後結閤圖模型使用HITS算法得到正文句子權重,進而得到文摘句.通過在鳳凰博客數據集上的實驗錶明,該文方法在ROUGE測度上優于以往方法.
Blog문장대응료대량평론신식,평론중우포함대량적조성,인차여하결합Blog평론획취Blog문장적주요내용시허다기우Blog적응용소요면림적난제.이왕제출적문적방법대다시침대다문당문적적통용방법,병미고필Blog문장적특수성,무법유효지결합평론래처리문장.해문통과분석Blog적특점제출료일충신적결합평론신식적Blog문적방법.해방법수선기우특정계산출평론적권중,연후결합도모형사용HITS산법득도정문구자권중,진이득도문적구.통과재봉황박객수거집상적실험표명,해문방법재ROUGE측도상우우이왕방법.