通信技术
通信技術
통신기술
COMMUNICATIONS TECHNOLOGY
2013年
7期
103-105
,共3页
木合塔尔·艾尔肯%艾斯卡尔·艾木都拉%地里木拉提·吐尔逊
木閤塔爾·艾爾肯%艾斯卡爾·艾木都拉%地裏木拉提·吐爾遜
목합탑이·애이긍%애사잡이·애목도랍%지리목랍제·토이손
维吾尔语%地名识别%地名词典%命名实体识别
維吾爾語%地名識彆%地名詞典%命名實體識彆
유오이어%지명식별%지명사전%명명실체식별
Uyghur%place name recognition%place name dictionary%named entity recognition
总结了维吾尔地名结构及其特点,并结合维吾尔地名内部结构特征,手动建立了基于新疆维吾尔自治区的地名词典库、首词库、中间词库和特征词库,研究了基于规则的维吾尔语地名识别方法和技术。以包含地名的较大规模维吾尔文本作为测试样本,利用地名内部结构和相邻词信息,通过匹配算法进行了地名识别,并用 Visual C++编程工具实现了维吾尔语地名识别算法。最后,给出了实验结果,并分析了出错原因及相应的对策。
總結瞭維吾爾地名結構及其特點,併結閤維吾爾地名內部結構特徵,手動建立瞭基于新疆維吾爾自治區的地名詞典庫、首詞庫、中間詞庫和特徵詞庫,研究瞭基于規則的維吾爾語地名識彆方法和技術。以包含地名的較大規模維吾爾文本作為測試樣本,利用地名內部結構和相鄰詞信息,通過匹配算法進行瞭地名識彆,併用 Visual C++編程工具實現瞭維吾爾語地名識彆算法。最後,給齣瞭實驗結果,併分析瞭齣錯原因及相應的對策。
총결료유오이지명결구급기특점,병결합유오이지명내부결구특정,수동건립료기우신강유오이자치구적지명사전고、수사고、중간사고화특정사고,연구료기우규칙적유오이어지명식별방법화기술。이포함지명적교대규모유오이문본작위측시양본,이용지명내부결구화상린사신식,통과필배산법진행료지명식별,병용 Visual C++편정공구실현료유오이어지명식별산법。최후,급출료실험결과,병분석료출착원인급상응적대책。
A research on the rule-based method for recognizing place names in text is conducted, and based on the internal structure feature of Uyghur place names, Xinjiang place name dictionary, first-word dictionary, middle-word dictionary and special word dictionary are established. Meanwhile, with large-scale text containing place names as the testing sample, and by using internal structure of place names and adjacent word information, the place name recognition could be realized through matching algorithm. And with Visual C++, the place name recognition system is achieved. Finally, an analysis is done on the experiment result, and this could serve as a reference for the further research.