中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2004年
2期
58-65
,共8页
计算机应用%中文信息处理%字符串匹配%模糊匹配%中文字符串匹配
計算機應用%中文信息處理%字符串匹配%模糊匹配%中文字符串匹配
계산궤응용%중문신식처리%자부천필배%모호필배%중문자부천필배
本文解决了中文字符串模糊匹配的两个主要问题:空间问题和时间问题.目前字符串模糊匹配的两个主要方法是位向量方法和过滤方法.由于汉字众多,应用位向量方法时,需要大量空间.对于某些内存很少的小型计算机,比如嵌入式系统,这将会是一个问题.本文改进了位向量方法,使其在应用于中文字符串时,空间需求降低到约5%.本文还利用汉字非常多的特点,提出一种新的基于过滤方法的中文字符串模糊匹配算法,BPM-BM,其速度比世界上最快的算法至少提高14%;在大部分情况下,是其速度的1.5~2倍.
本文解決瞭中文字符串模糊匹配的兩箇主要問題:空間問題和時間問題.目前字符串模糊匹配的兩箇主要方法是位嚮量方法和過濾方法.由于漢字衆多,應用位嚮量方法時,需要大量空間.對于某些內存很少的小型計算機,比如嵌入式繫統,這將會是一箇問題.本文改進瞭位嚮量方法,使其在應用于中文字符串時,空間需求降低到約5%.本文還利用漢字非常多的特點,提齣一種新的基于過濾方法的中文字符串模糊匹配算法,BPM-BM,其速度比世界上最快的算法至少提高14%;在大部分情況下,是其速度的1.5~2倍.
본문해결료중문자부천모호필배적량개주요문제:공간문제화시간문제.목전자부천모호필배적량개주요방법시위향량방법화과려방법.유우한자음다,응용위향량방법시,수요대량공간.대우모사내존흔소적소형계산궤,비여감입식계통,저장회시일개문제.본문개진료위향량방법,사기재응용우중문자부천시,공간수구강저도약5%.본문환이용한자비상다적특점,제출일충신적기우과려방법적중문자부천모호필배산법,BPM-BM,기속도비세계상최쾌적산법지소제고14%;재대부분정황하,시기속도적1.5~2배.