计算机应用与软件
計算機應用與軟件
계산궤응용여연건
COMPUTER APPLICATIONS AND SOFTWARE
2012年
4期
9-12,15
,共5页
玛依来·哈帕尔%古丽拉·阿东别克
瑪依來·哈帕爾%古麗拉·阿東彆剋
마의래·합파이%고려랍·아동별극
文本自动校对%哈萨克语%最小编辑距离%N元语法%模式匹配
文本自動校對%哈薩剋語%最小編輯距離%N元語法%模式匹配
문본자동교대%합살극어%최소편집거리%N원어법%모식필배
在啥萨克语文本非词查错方面,归纳和总结查错方法,在一定规模的哈萨克语词库的支持下,利用哈萨克语的特点,用哈萨克语词干切分程序和哈萨克语的音节规则,从文本中找出非词错误,再用最小编辑距离算法提供最有可能的候选词.在哈萨克语文本真词查错部分,根据上下文信息,采用基于N-gram的语言模型,利用文本的局部连接同现概率三元语法模型来进行真词查错,再用基于编辑距离的模式匹配方法对真词错误提供纠错建议.实验结果表明,系统的查错与纠错效率较好,实验方案是可行的.
在啥薩剋語文本非詞查錯方麵,歸納和總結查錯方法,在一定規模的哈薩剋語詞庫的支持下,利用哈薩剋語的特點,用哈薩剋語詞榦切分程序和哈薩剋語的音節規則,從文本中找齣非詞錯誤,再用最小編輯距離算法提供最有可能的候選詞.在哈薩剋語文本真詞查錯部分,根據上下文信息,採用基于N-gram的語言模型,利用文本的跼部連接同現概率三元語法模型來進行真詞查錯,再用基于編輯距離的模式匹配方法對真詞錯誤提供糾錯建議.實驗結果錶明,繫統的查錯與糾錯效率較好,實驗方案是可行的.
재사살극어문본비사사착방면,귀납화총결사착방법,재일정규모적합살극어사고적지지하,이용합살극어적특점,용합살극어사간절분정서화합살극어적음절규칙,종문본중조출비사착오,재용최소편집거리산법제공최유가능적후선사.재합살극어문본진사사착부분,근거상하문신식,채용기우N-gram적어언모형,이용문본적국부련접동현개솔삼원어법모형래진행진사사착,재용기우편집거리적모식필배방법대진사착오제공규착건의.실험결과표명,계통적사착여규착효솔교호,실험방안시가행적.