中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2013年
5期
160-165
,共6页
于洪志%李亚超%汪昆%冷本扎西
于洪誌%李亞超%汪昆%冷本扎西
우홍지%리아초%왕곤%랭본찰서
藏文%词性标注%最大熵%形态特征
藏文%詞性標註%最大熵%形態特徵
장문%사성표주%최대적%형태특정
Tibetan%part of speech%maximum entropy%morphological features
藏文词性标注是藏文信息处理中非常重要的基础性问题,该文以最大熵模型为基本框架,根据藏文的构词特征及统计分析结果,定义并选取特征模板,研究了融合语言特征的最大熵藏文词性标注模型.实验结果表明,最大熵模型能够较好的处理藏文词性标注问题,音节特征可以显著提高藏文词性标注的效果,与基准系统相比使错误率降低了6.4%.
藏文詞性標註是藏文信息處理中非常重要的基礎性問題,該文以最大熵模型為基本框架,根據藏文的構詞特徵及統計分析結果,定義併選取特徵模闆,研究瞭融閤語言特徵的最大熵藏文詞性標註模型.實驗結果錶明,最大熵模型能夠較好的處理藏文詞性標註問題,音節特徵可以顯著提高藏文詞性標註的效果,與基準繫統相比使錯誤率降低瞭6.4%.
장문사성표주시장문신식처리중비상중요적기출성문제,해문이최대적모형위기본광가,근거장문적구사특정급통계분석결과,정의병선취특정모판,연구료융합어언특정적최대적장문사성표주모형.실험결과표명,최대적모형능구교호적처리장문사성표주문제,음절특정가이현저제고장문사성표주적효과,여기준계통상비사착오솔강저료6.4%.