湖南大学学报(自然科学版)
湖南大學學報(自然科學版)
호남대학학보(자연과학판)
JOURNAL OF HUNAN UNIVERSITY(NATURAL SCIENCES EDITION)
2013年
2期
82-88
,共7页
廖志芳%邱丽霞%谢岳山%樊晓平
廖誌芳%邱麗霞%謝嶽山%樊曉平
료지방%구려하%사악산%번효평
HowNet%义原树状结构%语料库%语义相似度
HowNet%義原樹狀結構%語料庫%語義相似度
HowNet%의원수상결구%어료고%어의상사도
目前,在基于HowNet进行语句语义相似度计算的算法中,没有考虑语句中的 不同词语对语句之间相似度值的不同贡献程度,以致计算结果不理想.为了更好地解决上述缺陷,提出了一种频率增强语句语义相似度算法.该算法利用HowNet作为词典库,在同时考虑义原距离和义原深度的条件下,进行词语相似度计算;在此基础上算法进一步将词语在语料库中的频率函数作为权重值,引入至语句的语义相似度计算中,以降低高频率词语在语句相似度值中的比重.实验表明,改进的算法在语句相似度计算结果上与人们的主观判断更接近,结果更合理.
目前,在基于HowNet進行語句語義相似度計算的算法中,沒有攷慮語句中的 不同詞語對語句之間相似度值的不同貢獻程度,以緻計算結果不理想.為瞭更好地解決上述缺陷,提齣瞭一種頻率增彊語句語義相似度算法.該算法利用HowNet作為詞典庫,在同時攷慮義原距離和義原深度的條件下,進行詞語相似度計算;在此基礎上算法進一步將詞語在語料庫中的頻率函數作為權重值,引入至語句的語義相似度計算中,以降低高頻率詞語在語句相似度值中的比重.實驗錶明,改進的算法在語句相似度計算結果上與人們的主觀判斷更接近,結果更閤理.
목전,재기우HowNet진행어구어의상사도계산적산법중,몰유고필어구중적 불동사어대어구지간상사도치적불동공헌정도,이치계산결과불이상.위료경호지해결상술결함,제출료일충빈솔증강어구어의상사도산법.해산법이용HowNet작위사전고,재동시고필의원거리화의원심도적조건하,진행사어상사도계산;재차기출상산법진일보장사어재어료고중적빈솔함수작위권중치,인입지어구적어의상사도계산중,이강저고빈솔사어재어구상사도치중적비중.실험표명,개진적산법재어구상사도계산결과상여인문적주관판단경접근,결과경합리.