现代情报
現代情報
현대정보
Journal of Modern Information
2011年
11期
163~165
,共null页
潘国巍 吉久明 李楠 郑荣廷
潘國巍 吉久明 李楠 鄭榮廷
반국외 길구명 리남 정영정
中文化学物质名称 条件随机场 支持向量机 识别效果 识别效率
中文化學物質名稱 條件隨機場 支持嚮量機 識彆效果 識彆效率
중문화학물질명칭 조건수궤장 지지향량궤 식별효과 식별효솔
CRF; Chinese chemical substance names; labeled on char; labeled on word; Quantity of feature
与基于词典和基于规则的识别方法相比,统计机器学习方法更加适合被应用到命名实体的识别工作中来。本文主要在中文化学物质名称的识别工作中,考察两类统计机器学习模型识别效果及识别效率的优劣,实验结果表明,在所取训练语料与测试语料相同的情况下,以CRF模型为代表的条件概率模型可以展现出更好的实验性能。
與基于詞典和基于規則的識彆方法相比,統計機器學習方法更加適閤被應用到命名實體的識彆工作中來。本文主要在中文化學物質名稱的識彆工作中,攷察兩類統計機器學習模型識彆效果及識彆效率的優劣,實驗結果錶明,在所取訓練語料與測試語料相同的情況下,以CRF模型為代錶的條件概率模型可以展現齣更好的實驗性能。
여기우사전화기우규칙적식별방법상비,통계궤기학습방법경가괄합피응용도명명실체적식별공작중래。본문주요재중문화학물질명칭적식별공작중,고찰량류통계궤기학습모형식별효과급식별효솔적우렬,실험결과표명,재소취훈련어료여측시어료상동적정황하,이CRF모형위대표적조건개솔모형가이전현출경호적실험성능。
Comparing with the recognition methods based on dictionary or rule,the method based on machine learning is suitably to be applied to the research on NER(named entity recognition).This article mainly evaluated the performance of two kinds of machine learning methods SVM and CRF in the course of recognizing Chinese chemical substance names,and the result of the experiment showed:in the condition of selecting same training sample and testing sample,the conditional models(Take the CRF for example)reveal the better performance.