中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2010年
6期
31-36
,共6页
《知网》%词语相似度%句子相似度%共有信息%差异信息
《知網》%詞語相似度%句子相似度%共有信息%差異信息
《지망》%사어상사도%구자상사도%공유신식%차이신식
基于<知网>的词语(句子)相似度计算通常是把义原(词语)之间的最优匹配做为运算的基本单位的,最终的整体相似度数值可由每一部分的相似度值通过适当的加权计算合成而来,这样的做法往往会造成一些匹配对的信息重复和结构不合理.针对这个问题.该文通过统计出两个直接义原集合间的共有信息(共性)和差异信息(个性)来计算集合的相似度,并把此方法引入到词语(句子)的相似度计算中去,最终的实验比对结果表明该文所采用的方法更为稳定和有效.
基于<知網>的詞語(句子)相似度計算通常是把義原(詞語)之間的最優匹配做為運算的基本單位的,最終的整體相似度數值可由每一部分的相似度值通過適噹的加權計算閤成而來,這樣的做法往往會造成一些匹配對的信息重複和結構不閤理.針對這箇問題.該文通過統計齣兩箇直接義原集閤間的共有信息(共性)和差異信息(箇性)來計算集閤的相似度,併把此方法引入到詞語(句子)的相似度計算中去,最終的實驗比對結果錶明該文所採用的方法更為穩定和有效.
기우<지망>적사어(구자)상사도계산통상시파의원(사어)지간적최우필배주위운산적기본단위적,최종적정체상사도수치가유매일부분적상사도치통과괄당적가권계산합성이래,저양적주법왕왕회조성일사필배대적신식중복화결구불합리.침대저개문제.해문통과통계출량개직접의원집합간적공유신식(공성)화차이신식(개성)래계산집합적상사도,병파차방법인입도사어(구자)적상사도계산중거,최종적실험비대결과표명해문소채용적방법경위은정화유효.