计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2011年
35期
158-160,170
,共4页
姑丽加玛丽·麦麦提艾力%艾斯卡尔·肉孜%艾斯卡尔·艾木都拉
姑麗加瑪麗·麥麥提艾力%艾斯卡爾·肉孜%艾斯卡爾·艾木都拉
고려가마려·맥맥제애력%애사잡이·육자%애사잡이·애목도랍
维吾尔语%多音词%最大熵模型
維吾爾語%多音詞%最大熵模型
유오이어%다음사%최대적모형
维吾尔语中存在的形同音不同单词(多音词)的正确发音是影响合成系统可懂读的重要原因之一.维吾尔语单词由词根和词缀构成,虽然多音词词根数量不多,但多音词词根连接各种词缀则构成了大量的多音词.将维吾尔语中经常用错的16个多音词词根作为研究对象,以多音词的不同特点为出发点,采取不同的规则,结合最大熵模型方法采处理不符规则的多音词,同时用似然比方法选取关键词,并用贪婪算法选择最佳特征模板.经过性能测试,该算法多音词消歧平均准确率达到87.7%.
維吾爾語中存在的形同音不同單詞(多音詞)的正確髮音是影響閤成繫統可懂讀的重要原因之一.維吾爾語單詞由詞根和詞綴構成,雖然多音詞詞根數量不多,但多音詞詞根連接各種詞綴則構成瞭大量的多音詞.將維吾爾語中經常用錯的16箇多音詞詞根作為研究對象,以多音詞的不同特點為齣髮點,採取不同的規則,結閤最大熵模型方法採處理不符規則的多音詞,同時用似然比方法選取關鍵詞,併用貪婪算法選擇最佳特徵模闆.經過性能測試,該算法多音詞消歧平均準確率達到87.7%.
유오이어중존재적형동음불동단사(다음사)적정학발음시영향합성계통가동독적중요원인지일.유오이어단사유사근화사철구성,수연다음사사근수량불다,단다음사사근련접각충사철칙구성료대량적다음사.장유오이어중경상용착적16개다음사사근작위연구대상,이다음사적불동특점위출발점,채취불동적규칙,결합최대적모형방법채처리불부규칙적다음사,동시용사연비방법선취관건사,병용탐람산법선택최가특정모판.경과성능측시,해산법다음사소기평균준학솔체도87.7%.