情报杂志
情報雜誌
정보잡지
JOURNAL OF INFORMATION
2010年
9期
157-161,169
,共6页
滕青青%吉久明%郑荣廷%李楠
滕青青%吉久明%鄭榮廷%李楠
등청청%길구명%정영정%리남
中文命名实体识别%隐马尔可夫模型%最大熵模型%支持向量机%条件随机场
中文命名實體識彆%隱馬爾可伕模型%最大熵模型%支持嚮量機%條件隨機場
중문명명실체식별%은마이가부모형%최대적모형%지지향량궤%조건수궤장
命名实体识别(Named Entity Recognition)是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等.首先对我国关于命名实体识别研究的文献进行了总结,给出命名实体识别的主要方法及模型.并针对文献中对这些命名实体识别方法的效果进行统计分析,探讨各种识别对象、识别模型的效果及适用性.经过对现有研究文献的统计,结论为:在不考虑运行效率的情况下,对于机构名,识别效果最好的是层叠CRF模型;对于地名,测试效果最好的是CRF方法与专家知识相结合;人名识别方法中表现不错的则是边界模版和局部统计相结合的模型.
命名實體識彆(Named Entity Recognition)是指識彆文本中具有特定意義的實體,主要包括人名、地名、機構名、專有名詞等.首先對我國關于命名實體識彆研究的文獻進行瞭總結,給齣命名實體識彆的主要方法及模型.併針對文獻中對這些命名實體識彆方法的效果進行統計分析,探討各種識彆對象、識彆模型的效果及適用性.經過對現有研究文獻的統計,結論為:在不攷慮運行效率的情況下,對于機構名,識彆效果最好的是層疊CRF模型;對于地名,測試效果最好的是CRF方法與專傢知識相結閤;人名識彆方法中錶現不錯的則是邊界模版和跼部統計相結閤的模型.
명명실체식별(Named Entity Recognition)시지식별문본중구유특정의의적실체,주요포괄인명、지명、궤구명、전유명사등.수선대아국관우명명실체식별연구적문헌진행료총결,급출명명실체식별적주요방법급모형.병침대문헌중대저사명명실체식별방법적효과진행통계분석,탐토각충식별대상、식별모형적효과급괄용성.경과대현유연구문헌적통계,결론위:재불고필운행효솔적정황하,대우궤구명,식별효과최호적시층첩CRF모형;대우지명,측시효과최호적시CRF방법여전가지식상결합;인명식별방법중표현불착적칙시변계모판화국부통계상결합적모형.