广东工业大学学报
廣東工業大學學報
엄동공업대학학보
JOURNAL OF GUANGDONG UNIVERSITY OF TECHNOLOGY
2014年
3期
88-94
,共7页
规则%正则表达式%时间表达式识别%规范化
規則%正則錶達式%時間錶達式識彆%規範化
규칙%정칙표체식%시간표체식식별%규범화
rule%regular expressions%recognition of time expressions%normalization
为了解决文本时间表达式的识别与规范化问题,针对时间表达式在形式上的多样性与非结构化,提出了对时态元素进行刻画的思想,划分时间表达式类别及规范形式;在此基础上,采用正则表达式与Trie树结构相结合的方式构建出时间短语识别树,自动进行中文时间表达式的识别与分类;最后,提出规范化算法与修正算法处理识别后的结果,得到规范化形式。以中文语料进行实验,中文表达式识别与规范化工作达到较好的效果。
為瞭解決文本時間錶達式的識彆與規範化問題,針對時間錶達式在形式上的多樣性與非結構化,提齣瞭對時態元素進行刻畫的思想,劃分時間錶達式類彆及規範形式;在此基礎上,採用正則錶達式與Trie樹結構相結閤的方式構建齣時間短語識彆樹,自動進行中文時間錶達式的識彆與分類;最後,提齣規範化算法與脩正算法處理識彆後的結果,得到規範化形式。以中文語料進行實驗,中文錶達式識彆與規範化工作達到較好的效果。
위료해결문본시간표체식적식별여규범화문제,침대시간표체식재형식상적다양성여비결구화,제출료대시태원소진행각화적사상,화분시간표체식유별급규범형식;재차기출상,채용정칙표체식여Trie수결구상결합적방식구건출시간단어식별수,자동진행중문시간표체식적식별여분류;최후,제출규범화산법여수정산법처리식별후적결과,득도규범화형식。이중문어료진행실험,중문표체식식별여규범화공작체도교호적효과。
Concerning the problem with the recognition and normalization of time expressions in texts , ai-ming at the diversity and unstructured forms of time expressions , it proposed the idea of describing tempo-ral elements to divide the types of time expressions and their forms of normalization .With the method that combined regular expressions with Trie tree structure , it built the recognition tree of time expressions , which could recognize time expressions automatically .Finally, it proposed the normalization algorithm and correction algorithm to deal with the recognized results .The results are pretty good .