中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2013年
6期
187-191
,共5页
高廷丽%陶建华%戴红亮%李雅
高廷麗%陶建華%戴紅亮%李雅
고정려%도건화%대홍량%리아
傣文%分词%CRF%绝对切分词
傣文%分詞%CRF%絕對切分詞
태문%분사%CRF%절대절분사
Daiwen%segmentation%CRF%absolute segmentation word
傣文自动分词是傣文信息处理中的基础工作,是后续进行傣文输入法开发、傣文自动机器翻译系统开发、傣文文本信息抽取等傣文信息处理的基础,受限于傣语语料库技术,傣文自然语言处理技术较为薄弱.本文首先对傣文特点进行了分析,并在此基础上构建了傣文语料库,同时将中文分词方法应用到傣文中,结合傣文自身的特点,设计了—个基于音节序列标注的傣文分词系统,经过实验,该分词系统达到了95.58%的综合评价值.
傣文自動分詞是傣文信息處理中的基礎工作,是後續進行傣文輸入法開髮、傣文自動機器翻譯繫統開髮、傣文文本信息抽取等傣文信息處理的基礎,受限于傣語語料庫技術,傣文自然語言處理技術較為薄弱.本文首先對傣文特點進行瞭分析,併在此基礎上構建瞭傣文語料庫,同時將中文分詞方法應用到傣文中,結閤傣文自身的特點,設計瞭—箇基于音節序列標註的傣文分詞繫統,經過實驗,該分詞繫統達到瞭95.58%的綜閤評價值.
태문자동분사시태문신식처리중적기출공작,시후속진행태문수입법개발、태문자동궤기번역계통개발、태문문본신식추취등태문신식처리적기출,수한우태어어료고기술,태문자연어언처리기술교위박약.본문수선대태문특점진행료분석,병재차기출상구건료태문어료고,동시장중문분사방법응용도태문중,결합태문자신적특점,설계료—개기우음절서렬표주적태문분사계통,경과실험,해분사계통체도료95.58%적종합평개치.