计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2008年
5期
131-133
,共3页
信息处理%知网%概念%主题聚类%主题划分
信息處理%知網%概唸%主題聚類%主題劃分
신식처리%지망%개념%주제취류%주제화분
对多个相关文档进行主题划分对于信息检索、自动摘要等研究领域都有重要的应用价值.当前流行的文本主题划分技术中,多采用词频向量进行文本表示,而研究表明将特征向量映射到概念级,将改善多文档主题划分的效果.本文提出了一种应用知网(HowNet)来获取多文本的概念作为特征向量,再应用聚类的方法对文档集中的相似段落进行归类,得到主题划分的结果,解决了多文档的结构分析问题.实验结果表明该方法对多个相关文档的主题划分取得了良好的效果.
對多箇相關文檔進行主題劃分對于信息檢索、自動摘要等研究領域都有重要的應用價值.噹前流行的文本主題劃分技術中,多採用詞頻嚮量進行文本錶示,而研究錶明將特徵嚮量映射到概唸級,將改善多文檔主題劃分的效果.本文提齣瞭一種應用知網(HowNet)來穫取多文本的概唸作為特徵嚮量,再應用聚類的方法對文檔集中的相似段落進行歸類,得到主題劃分的結果,解決瞭多文檔的結構分析問題.實驗結果錶明該方法對多箇相關文檔的主題劃分取得瞭良好的效果.
대다개상관문당진행주제화분대우신식검색、자동적요등연구영역도유중요적응용개치.당전류행적문본주제화분기술중,다채용사빈향량진행문본표시,이연구표명장특정향량영사도개념급,장개선다문당주제화분적효과.본문제출료일충응용지망(HowNet)래획취다문본적개념작위특정향량,재응용취류적방법대문당집중적상사단락진행귀류,득도주제화분적결과,해결료다문당적결구분석문제.실험결과표명해방법대다개상관문당적주제화분취득료량호적효과.