计算机与数字工程
計算機與數字工程
계산궤여수자공정
COMPUTER & DIGITAL ENGINEERING
2010年
12期
36-40
,共5页
最大熵%中文组织机构名%识别%自然语言处理
最大熵%中文組織機構名%識彆%自然語言處理
최대적%중문조직궤구명%식별%자연어언처리
中文组织机构名识别的精确率一直是影响自然语言处理的因素之一.根据中文组织机构名的特点,提出采用最大熵的识别方法.实验系统在较大规模的数据集上对比了不同特征选择方法对模型的影响,同时考查了词面、词性、语法等信息对模型的贡献.实验结果表明,不同的特征选择算法,开放测试的平均值只相差0.2~0.5个百分点.
中文組織機構名識彆的精確率一直是影響自然語言處理的因素之一.根據中文組織機構名的特點,提齣採用最大熵的識彆方法.實驗繫統在較大規模的數據集上對比瞭不同特徵選擇方法對模型的影響,同時攷查瞭詞麵、詞性、語法等信息對模型的貢獻.實驗結果錶明,不同的特徵選擇算法,開放測試的平均值隻相差0.2~0.5箇百分點.
중문조직궤구명식별적정학솔일직시영향자연어언처리적인소지일.근거중문조직궤구명적특점,제출채용최대적적식별방법.실험계통재교대규모적수거집상대비료불동특정선택방법대모형적영향,동시고사료사면、사성、어법등신식대모형적공헌.실험결과표명,불동적특정선택산법,개방측시적평균치지상차0.2~0.5개백분점.