四川师范大学学报(自然科学版)
四川師範大學學報(自然科學版)
사천사범대학학보(자연과학판)
JOURNAL OF SICHUAN NORMAL UNIVERSITY(NATURAL SCIENCE)
2010年
4期
554-558
,共5页
语义分析%相似度%切分歧义%汉语文献%特征提取%加权词频
語義分析%相似度%切分歧義%漢語文獻%特徵提取%加權詞頻
어의분석%상사도%절분기의%한어문헌%특정제취%가권사빈
相似性文献检测技术在数字图书馆、知识产权保护等应用中有着较强的实际意义和应用价值.汉语中存在着许多歧义现象,导致汉语相似性文献检测的难度远大于英文文献.结合汉语的特点,提出了一种改进的基于词频统计的汉语相似性文献检测方法.首先,利用关键词和统计信息进行切词与消歧.其次,在语义分析的基础上抽取特征词并计算权重.最后,通过构造加权词频向量空间完成相似性检测.对本科生毕业论文的小规模实验表明:该方法能有效消除切分歧义,降低运算规模,提高检测精度与速度.
相似性文獻檢測技術在數字圖書館、知識產權保護等應用中有著較彊的實際意義和應用價值.漢語中存在著許多歧義現象,導緻漢語相似性文獻檢測的難度遠大于英文文獻.結閤漢語的特點,提齣瞭一種改進的基于詞頻統計的漢語相似性文獻檢測方法.首先,利用關鍵詞和統計信息進行切詞與消歧.其次,在語義分析的基礎上抽取特徵詞併計算權重.最後,通過構造加權詞頻嚮量空間完成相似性檢測.對本科生畢業論文的小規模實驗錶明:該方法能有效消除切分歧義,降低運算規模,提高檢測精度與速度.
상사성문헌검측기술재수자도서관、지식산권보호등응용중유착교강적실제의의화응용개치.한어중존재착허다기의현상,도치한어상사성문헌검측적난도원대우영문문헌.결합한어적특점,제출료일충개진적기우사빈통계적한어상사성문헌검측방법.수선,이용관건사화통계신식진행절사여소기.기차,재어의분석적기출상추취특정사병계산권중.최후,통과구조가권사빈향량공간완성상사성검측.대본과생필업논문적소규모실험표명:해방법능유효소제절분기의,강저운산규모,제고검측정도여속도.