湖北工业大学学报
湖北工業大學學報
호북공업대학학보
JOURNAL OF HUBEI UNIVERSITY OF TECHNOLOGY
2015年
1期
36-38,55
,共4页
中文分词%相似度比较%距离矩阵
中文分詞%相似度比較%距離矩陣
중문분사%상사도비교%거리구진
提出一种特殊标记符和词根沙普利值二步骤分词模型,提高分词的准确率,通过搜索引擎指数来识别新词.在相似度比较方面,提出了带行列顺序罚分因子距离矩阵模型,该模型综合了向量检测、汉明距离和最长公共子串的特点,重新定义了距离矩阵.与传统的论文相似性检索相比,具有分词准确,计算量小等优点.
提齣一種特殊標記符和詞根沙普利值二步驟分詞模型,提高分詞的準確率,通過搜索引擎指數來識彆新詞.在相似度比較方麵,提齣瞭帶行列順序罰分因子距離矩陣模型,該模型綜閤瞭嚮量檢測、漢明距離和最長公共子串的特點,重新定義瞭距離矩陣.與傳統的論文相似性檢索相比,具有分詞準確,計算量小等優點.
제출일충특수표기부화사근사보리치이보취분사모형,제고분사적준학솔,통과수색인경지수래식별신사.재상사도비교방면,제출료대행렬순서벌분인자거리구진모형,해모형종합료향량검측、한명거리화최장공공자천적특점,중신정의료거리구진.여전통적논문상사성검색상비,구유분사준학,계산량소등우점.