计算机应用与软件
計算機應用與軟件
계산궤응용여연건
COMPUTER APPLICATIONS AND SOFTWARE
2014年
9期
40-44
,共5页
文本分割%自动文摘%HowNet
文本分割%自動文摘%HowNet
문본분할%자동문적%HowNet
Text segmentation%Auto-abstract%HowNet
提出一种基于文本分割技术的多文档自动文摘方法。该方法使用HowNet作为概念获取工具,通过建立句子概念向量空间模型和利用改进的DotPlotting模型来进行文本分割。利用建立的句子概念向量空间模型计算句子重要度,并根据句子重要度、文本分割结果和文摘句相似度等因素产生文本。使用ROUGE-N评测方法和F_Score作为评测指标对系统产生的文摘进行评测,结果显示使用文本分割技术进行多文档是有效的。
提齣一種基于文本分割技術的多文檔自動文摘方法。該方法使用HowNet作為概唸穫取工具,通過建立句子概唸嚮量空間模型和利用改進的DotPlotting模型來進行文本分割。利用建立的句子概唸嚮量空間模型計算句子重要度,併根據句子重要度、文本分割結果和文摘句相似度等因素產生文本。使用ROUGE-N評測方法和F_Score作為評測指標對繫統產生的文摘進行評測,結果顯示使用文本分割技術進行多文檔是有效的。
제출일충기우문본분할기술적다문당자동문적방법。해방법사용HowNet작위개념획취공구,통과건립구자개념향량공간모형화이용개진적DotPlotting모형래진행문본분할。이용건립적구자개념향량공간모형계산구자중요도,병근거구자중요도、문본분할결과화문적구상사도등인소산생문본。사용ROUGE-N평측방법화F_Score작위평측지표대계통산생적문적진행평측,결과현시사용문본분할기술진행다문당시유효적。
Inthispaper,weproposeamulti-documentauto-abstract method which isbasedontext segmentation technology.Themethod uses HowNet as the conceptual access tool,and segments the text through constructing the concept vector space model (CVSM)of sentence and using improved DotPlotting model.The CVSM of sentence is used to compute the importance degree of the sentences,and the text abstract is generated according to the factors of sentences importance degree,text segmentation result and the similarity of the sentences in abstract,etc.ROUGE-N evaluation method and F_Score are used as the evaluation index to evaluate the abstract formed by the system,the results show that to use text segmentation technology for multi-document abstract is effective.