北京邮电大学学报
北京郵電大學學報
북경유전대학학보
JOURNAL OF BEIJING UNIVERSITY OF POSTS AND TELECOMMUNICATIONS
2006年
z2期
54-58
,共5页
王浩畅%赵铁军%刘延力%于浩
王浩暢%趙鐵軍%劉延力%于浩
왕호창%조철군%류연력%우호
命名实体识别%特征选择%支持向量机%条件随机域
命名實體識彆%特徵選擇%支持嚮量機%條件隨機域
명명실체식별%특정선택%지지향량궤%조건수궤역
介绍了使用机器学习方法进行生物医学文本命名实体识别的技术,包括Generalized Winnow算法、支持向量机方法和条件随机域模型.根据学习算法的特点,识别过程中使用了丰富的特征集,包括局部特征、全文特征及外部资源特征.各种类型特征的优化组合、识别结果的后处理,包括缩写词识别、嵌套词识别及边界校正等都提升了命名实体识别系统的性能.实验结果表明,通过上述策略的应用,系统取得了很好的识别结果.
介紹瞭使用機器學習方法進行生物醫學文本命名實體識彆的技術,包括Generalized Winnow算法、支持嚮量機方法和條件隨機域模型.根據學習算法的特點,識彆過程中使用瞭豐富的特徵集,包括跼部特徵、全文特徵及外部資源特徵.各種類型特徵的優化組閤、識彆結果的後處理,包括縮寫詞識彆、嵌套詞識彆及邊界校正等都提升瞭命名實體識彆繫統的性能.實驗結果錶明,通過上述策略的應用,繫統取得瞭很好的識彆結果.
개소료사용궤기학습방법진행생물의학문본명명실체식별적기술,포괄Generalized Winnow산법、지지향량궤방법화조건수궤역모형.근거학습산법적특점,식별과정중사용료봉부적특정집,포괄국부특정、전문특정급외부자원특정.각충류형특정적우화조합、식별결과적후처리,포괄축사사식별、감투사식별급변계교정등도제승료명명실체식별계통적성능.실험결과표명,통과상술책략적응용,계통취득료흔호적식별결과.