计算机仿真
計算機倣真
계산궤방진
COMPUTER SIMULATION
2011年
3期
414-417
,共4页
最大熵%名词短语%特征提取%机器翻译
最大熵%名詞短語%特徵提取%機器翻譯
최대적%명사단어%특정제취%궤기번역
研究英语名词短语识别不仅是句法分析的基本问题,而且是进行机器翻译的基础.针对英语名词短语传统识别算法存在速度慢,效率低的难题,为提高识别准确率,提出一种基于最大熵原理的英语基本名词短语识别方法.首先综合考虑英语短语结构特性和上下文的位置来建立特征集模板.采用改进的频次和平均互信息相结合方法提取有效特征,表示为最大熵模型形式,最大熵原理完成最后的识别过程.对Penn Treebank语料库中的英语名词短语进行仿真,证明改进方法对短语识别正确率和召回率均达90%以上,远远高于传统方法的识别率,是一种简单、快速、高效的英语名词短语识别方法.
研究英語名詞短語識彆不僅是句法分析的基本問題,而且是進行機器翻譯的基礎.針對英語名詞短語傳統識彆算法存在速度慢,效率低的難題,為提高識彆準確率,提齣一種基于最大熵原理的英語基本名詞短語識彆方法.首先綜閤攷慮英語短語結構特性和上下文的位置來建立特徵集模闆.採用改進的頻次和平均互信息相結閤方法提取有效特徵,錶示為最大熵模型形式,最大熵原理完成最後的識彆過程.對Penn Treebank語料庫中的英語名詞短語進行倣真,證明改進方法對短語識彆正確率和召迴率均達90%以上,遠遠高于傳統方法的識彆率,是一種簡單、快速、高效的英語名詞短語識彆方法.
연구영어명사단어식별불부시구법분석적기본문제,이차시진행궤기번역적기출.침대영어명사단어전통식별산법존재속도만,효솔저적난제,위제고식별준학솔,제출일충기우최대적원리적영어기본명사단어식별방법.수선종합고필영어단어결구특성화상하문적위치래건립특정집모판.채용개진적빈차화평균호신식상결합방법제취유효특정,표시위최대적모형형식,최대적원리완성최후적식별과정.대Penn Treebank어료고중적영어명사단어진행방진,증명개진방법대단어식별정학솔화소회솔균체90%이상,원원고우전통방법적식별솔,시일충간단、쾌속、고효적영어명사단어식별방법.