中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2009年
3期
121-128
,共8页
马力%焦李成%白琳%周雅夫%董洛兵
馬力%焦李成%白琳%週雅伕%董洛兵
마력%초리성%백림%주아부%동락병
计算机应用%中文信息处理%小世界网络%词语网络%平均最短路径变化量%聚类系数变化量%复合关键词
計算機應用%中文信息處理%小世界網絡%詞語網絡%平均最短路徑變化量%聚類繫數變化量%複閤關鍵詞
계산궤응용%중문신식처리%소세계망락%사어망락%평균최단로경변화량%취류계수변화량%복합관건사
该文提出了一种新的基于小世界网络特性的关键词提取算法.首先,利用K最邻近耦合图构成方式,将文档表示成为词语网络.引入词语聚类系数变化量和平均最短路径变化量来度量词语的重要性,选择重要性大的词语组成候选关键词集.利用侯选关键词集词语位置关系和汉语词性搭配关系,提取出复合关键词. 实验结果表明该方法是可行和有效的,获取复合关键词比一般关键词所表达的含义更便于人们对文本的理解.
該文提齣瞭一種新的基于小世界網絡特性的關鍵詞提取算法.首先,利用K最鄰近耦閤圖構成方式,將文檔錶示成為詞語網絡.引入詞語聚類繫數變化量和平均最短路徑變化量來度量詞語的重要性,選擇重要性大的詞語組成候選關鍵詞集.利用侯選關鍵詞集詞語位置關繫和漢語詞性搭配關繫,提取齣複閤關鍵詞. 實驗結果錶明該方法是可行和有效的,穫取複閤關鍵詞比一般關鍵詞所錶達的含義更便于人們對文本的理解.
해문제출료일충신적기우소세계망락특성적관건사제취산법.수선,이용K최린근우합도구성방식,장문당표시성위사어망락.인입사어취류계수변화량화평균최단로경변화량래도량사어적중요성,선택중요성대적사어조성후선관건사집.이용후선관건사집사어위치관계화한어사성탑배관계,제취출복합관건사. 실험결과표명해방법시가행화유효적,획취복합관건사비일반관건사소표체적함의경편우인문대문본적리해.