中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2005年
5期
76-83
,共8页
靳简明%丁晓青%彭良瑞%王华
靳簡明%丁曉青%彭良瑞%王華
근간명%정효청%팽량서%왕화
计算机应用%中文信息处理%文本切割%字符切割%字符识别%维吾尔文
計算機應用%中文信息處理%文本切割%字符切割%字符識彆%維吾爾文
계산궤응용%중문신식처리%문본절할%자부절할%자부식별%유오이문
我国新疆地区使用的维吾尔文借用阿拉伯文字母书写.因为阿拉伯文字母自身书写的特点,造成维文文本的切割和识别极其困难.本文在连通体分类的基础上,结合水平投影和连通体分析的方法实现维文文本的文字行切分和单词切分.然后定位单词基线位置,计算单词轮廓和基线的距离,寻找所有可能的切点实现维文单词过切割,最后利用规则合并过切分字符.实验结果表明,字符切割准确率达到99%以上.
我國新疆地區使用的維吾爾文藉用阿拉伯文字母書寫.因為阿拉伯文字母自身書寫的特點,造成維文文本的切割和識彆極其睏難.本文在連通體分類的基礎上,結閤水平投影和連通體分析的方法實現維文文本的文字行切分和單詞切分.然後定位單詞基線位置,計算單詞輪廓和基線的距離,尋找所有可能的切點實現維文單詞過切割,最後利用規則閤併過切分字符.實驗結果錶明,字符切割準確率達到99%以上.
아국신강지구사용적유오이문차용아랍백문자모서사.인위아랍백문자모자신서사적특점,조성유문문본적절할화식별겁기곤난.본문재련통체분류적기출상,결합수평투영화련통체분석적방법실현유문문본적문자행절분화단사절분.연후정위단사기선위치,계산단사륜곽화기선적거리,심조소유가능적절점실현유문단사과절할,최후이용규칙합병과절분자부.실험결과표명,자부절할준학솔체도99%이상.