计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2011年
15期
164-167
,共4页
朱莎莎%刘宗田%付剑锋%朱芳
硃莎莎%劉宗田%付劍鋒%硃芳
주사사%류종전%부검봉%주방
中文时间短语%时间短语识别%条件随机场%时间信息处理
中文時間短語%時間短語識彆%條件隨機場%時間信息處理
중문시간단어%시간단어식별%조건수궤장%시간신식처리
传统时间短语识别方法存在中文文本时间短语边界定位不准确和长距离依赖的问题.为此,提出一种基于条件随机场(CRFs)的时间短语识别方法.采用基于机器学习的方法识别时间短语,分析中文文本中时间短语的词法、句法和上下文信息等语言学特征,将时间短语分为日期型和事件型2种类型,并半自动构建3个常用词表作为外部特征.在此基础上,引入能整合不同层面特征的CRFs方法,将识别问题转化为序列标注问题.实验结果表明,该方法在日期型时间短语和事件型时间短语识别上分别取得95.70%和85.75%的F1值,识别效果较好.
傳統時間短語識彆方法存在中文文本時間短語邊界定位不準確和長距離依賴的問題.為此,提齣一種基于條件隨機場(CRFs)的時間短語識彆方法.採用基于機器學習的方法識彆時間短語,分析中文文本中時間短語的詞法、句法和上下文信息等語言學特徵,將時間短語分為日期型和事件型2種類型,併半自動構建3箇常用詞錶作為外部特徵.在此基礎上,引入能整閤不同層麵特徵的CRFs方法,將識彆問題轉化為序列標註問題.實驗結果錶明,該方法在日期型時間短語和事件型時間短語識彆上分彆取得95.70%和85.75%的F1值,識彆效果較好.
전통시간단어식별방법존재중문문본시간단어변계정위불준학화장거리의뢰적문제.위차,제출일충기우조건수궤장(CRFs)적시간단어식별방법.채용기우궤기학습적방법식별시간단어,분석중문문본중시간단어적사법、구법화상하문신식등어언학특정,장시간단어분위일기형화사건형2충류형,병반자동구건3개상용사표작위외부특정.재차기출상,인입능정합불동층면특정적CRFs방법,장식별문제전화위서렬표주문제.실험결과표명,해방법재일기형시간단어화사건형시간단어식별상분별취득95.70%화85.75%적F1치,식별효과교호.