电脑知识与技术
電腦知識與技術
전뇌지식여기술
COMPUTER KNOWLEDGE AND TECHNOLOGY
2012年
23期
5530-5533
,共4页
何晓明%洪亲%蔡坚勇%林鸿
何曉明%洪親%蔡堅勇%林鴻
하효명%홍친%채견용%림홍
模糊查询%n-gram%字符串分割%编辑距离%数据挖掘
模糊查詢%n-gram%字符串分割%編輯距離%數據挖掘
모호사순%n-gram%자부천분할%편집거리%수거알굴
相似字符串的模糊查询是信息检索的重要组成部分,一直是人们研究的热点.目前基于关键词的查询技术都是前缀匹配,无法查找到与搜索字符串相似的结果.该文提出一种基于n-gram的中英文字符串分割技术的算法,该技术主要是对字符串进行中英文识别,然后基于n - gram按照指定长度进行分割,该技术是实现基于关键词的模糊查询技术的基础.该技术在数据清洗以及学位论文TMLC系统和垃圾邮件过滤等方面也有重要的应用前景.
相似字符串的模糊查詢是信息檢索的重要組成部分,一直是人們研究的熱點.目前基于關鍵詞的查詢技術都是前綴匹配,無法查找到與搜索字符串相似的結果.該文提齣一種基于n-gram的中英文字符串分割技術的算法,該技術主要是對字符串進行中英文識彆,然後基于n - gram按照指定長度進行分割,該技術是實現基于關鍵詞的模糊查詢技術的基礎.該技術在數據清洗以及學位論文TMLC繫統和垃圾郵件過濾等方麵也有重要的應用前景.
상사자부천적모호사순시신식검색적중요조성부분,일직시인문연구적열점.목전기우관건사적사순기술도시전철필배,무법사조도여수색자부천상사적결과.해문제출일충기우n-gram적중영문자부천분할기술적산법,해기술주요시대자부천진행중영문식별,연후기우n - gram안조지정장도진행분할,해기술시실현기우관건사적모호사순기술적기출.해기술재수거청세이급학위논문TMLC계통화랄급유건과려등방면야유중요적응용전경.