中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2010年
4期
3-10
,共8页
邬桐%周雅倩%黄萱菁%吴立德
鄔桐%週雅倩%黃萱菁%吳立德
오동%주아천%황훤정%오립덕
计算机应用%中文信息处理%时间表达式识别%时间基元%Timex2%错误驱动%正则表达式
計算機應用%中文信息處理%時間錶達式識彆%時間基元%Timex2%錯誤驅動%正則錶達式
계산궤응용%중문신식처리%시간표체식식별%시간기원%Timex2%착오구동%정칙표체식
该文提出一种基于正则文法的时间表达式识别算法:它基于"时间基元"①进行规则构建,提高了时间表达式识别的召回率;同时使用基于错误驱动思想的规则剪枝算法,削减了从训练语料带来的噪声,提高了识别的正确率,两者搭配有效提高了系统整体性能.在ACE07中文语料上的实验结果显著超过了现有水平,F-score达到89.9%.该文提出的算法具有很好的通用性和扩展性,加以改进将可以有更广泛的应用.
該文提齣一種基于正則文法的時間錶達式識彆算法:它基于"時間基元"①進行規則構建,提高瞭時間錶達式識彆的召迴率;同時使用基于錯誤驅動思想的規則剪枝算法,削減瞭從訓練語料帶來的譟聲,提高瞭識彆的正確率,兩者搭配有效提高瞭繫統整體性能.在ACE07中文語料上的實驗結果顯著超過瞭現有水平,F-score達到89.9%.該文提齣的算法具有很好的通用性和擴展性,加以改進將可以有更廣汎的應用.
해문제출일충기우정칙문법적시간표체식식별산법:타기우"시간기원"①진행규칙구건,제고료시간표체식식별적소회솔;동시사용기우착오구동사상적규칙전지산법,삭감료종훈련어료대래적조성,제고료식별적정학솔,량자탑배유효제고료계통정체성능.재ACE07중문어료상적실험결과현저초과료현유수평,F-score체도89.9%.해문제출적산법구유흔호적통용성화확전성,가이개진장가이유경엄범적응용.