计算机工程与设计
計算機工程與設計
계산궤공정여설계
COMPUTER ENGINEERING AND DESIGN
2008年
3期
765-767
,共3页
文本检索%关键字提取%偏向度%聚类
文本檢索%關鍵字提取%偏嚮度%聚類
문본검색%관건자제취%편향도%취류
传统的关键字提取算法往往是基于高频词提取的,但文档中的关键字往往并不都是高频词,因此还需要从非高频词集中找出关键字.把一篇文档抽象为一个图:结点表示词语,边表示词语的同现关系;并基于文档的这种拓扑结构,提出了一种新的关键字提取算法,并和传统的关键字提取算法作了比较,在精确率,覆盖率方面均有不错的效果.
傳統的關鍵字提取算法往往是基于高頻詞提取的,但文檔中的關鍵字往往併不都是高頻詞,因此還需要從非高頻詞集中找齣關鍵字.把一篇文檔抽象為一箇圖:結點錶示詞語,邊錶示詞語的同現關繫;併基于文檔的這種拓撲結構,提齣瞭一種新的關鍵字提取算法,併和傳統的關鍵字提取算法作瞭比較,在精確率,覆蓋率方麵均有不錯的效果.
전통적관건자제취산법왕왕시기우고빈사제취적,단문당중적관건자왕왕병불도시고빈사,인차환수요종비고빈사집중조출관건자.파일편문당추상위일개도:결점표시사어,변표시사어적동현관계;병기우문당적저충탁복결구,제출료일충신적관건자제취산법,병화전통적관건자제취산법작료비교,재정학솔,복개솔방면균유불착적효과.