计算机工程与设计
計算機工程與設計
계산궤공정여설계
COMPUTER ENGINEERING AND DESIGN
2014年
2期
625-630
,共6页
邹岳琳%吐尔根·依布拉音%麦热哈巴·艾力%艾山·吾买尔%帕力旦·吐尔逊
鄒嶽琳%吐爾根·依佈拉音%麥熱哈巴·艾力%艾山·吾買爾%帕力旦·吐爾遜
추악림%토이근·의포랍음%맥열합파·애력%애산·오매이%파력단·토이손
自然语言处理%时间短语%条件随机场%黏着语%事件类时间%特征选择%词干提取
自然語言處理%時間短語%條件隨機場%黏著語%事件類時間%特徵選擇%詞榦提取
자연어언처리%시간단어%조건수궤장%점착어%사건류시간%특정선택%사간제취
natural language processing (NLP)%temporal expression%conditional random fields (CRFs)%agglutinative language%event-anchored temporal expressions%feature selection%stemming
针对维吾尔语事件类时间短语没有明显时间词特征词而引起的识别困难和边界定位不准确等问题,提出了一种统计结合词干提取的针对黏着性语言的事件类时间短语的识别方法.根据维吾尔语典型的黏着性语言形态特点,对时间短语构成进行分析和分类,采用机器学习的方法将难于识别的事件类隐性时间短语识别问题转换为基于统计方法的序列标注;通过对维吾尔语事件类时间要素分析及维吾尔语构词的研究,引入黏着语特有的词干特征,选定实验特征集合,对比分析不同的特征集合的自动识别准确率的平均值.实验结果表明,该方法对维吾尔语事件类时间短语识别的F-值达到85.37%.这一结果对其它黏着性语言的研究具有参考意义.
針對維吾爾語事件類時間短語沒有明顯時間詞特徵詞而引起的識彆睏難和邊界定位不準確等問題,提齣瞭一種統計結閤詞榦提取的針對黏著性語言的事件類時間短語的識彆方法.根據維吾爾語典型的黏著性語言形態特點,對時間短語構成進行分析和分類,採用機器學習的方法將難于識彆的事件類隱性時間短語識彆問題轉換為基于統計方法的序列標註;通過對維吾爾語事件類時間要素分析及維吾爾語構詞的研究,引入黏著語特有的詞榦特徵,選定實驗特徵集閤,對比分析不同的特徵集閤的自動識彆準確率的平均值.實驗結果錶明,該方法對維吾爾語事件類時間短語識彆的F-值達到85.37%.這一結果對其它黏著性語言的研究具有參攷意義.
침대유오이어사건류시간단어몰유명현시간사특정사이인기적식별곤난화변계정위불준학등문제,제출료일충통계결합사간제취적침대점착성어언적사건류시간단어적식별방법.근거유오이어전형적점착성어언형태특점,대시간단어구성진행분석화분류,채용궤기학습적방법장난우식별적사건류은성시간단어식별문제전환위기우통계방법적서렬표주;통과대유오이어사건류시간요소분석급유오이어구사적연구,인입점착어특유적사간특정,선정실험특정집합,대비분석불동적특정집합적자동식별준학솔적평균치.실험결과표명,해방법대유오이어사건류시간단어식별적F-치체도85.37%.저일결과대기타점착성어언적연구구유삼고의의.