计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2003年
3期
440-446
,共7页
周雅倩%郭以昆%黄萱菁%吴立德
週雅倩%郭以昆%黃萱菁%吳立德
주아천%곽이곤%황훤정%오립덕
最大熵%基本名词短语%自然语言处理
最大熵%基本名詞短語%自然語言處理
최대적%기본명사단어%자연어언처리
使用了基于最大熵的方法识别中文基本名词短语.在开放语料Chinese TreeBank上,只使用词性标注,达到了平均87.43%/88.09%的查全率/准确率.由于,关于中文的基本名词短语识别的结果没有很好的可比性,又使用相同的算法,尝试了英文的基本名词短语识别.在英文标准语料TREEBANK Ⅱ上,开放测试达到了93.31%/93.04%的查全率/准确率,极为接近国际最优水平.这既证明了此算法的行之有效,又表明该方法的语言无关性.
使用瞭基于最大熵的方法識彆中文基本名詞短語.在開放語料Chinese TreeBank上,隻使用詞性標註,達到瞭平均87.43%/88.09%的查全率/準確率.由于,關于中文的基本名詞短語識彆的結果沒有很好的可比性,又使用相同的算法,嘗試瞭英文的基本名詞短語識彆.在英文標準語料TREEBANK Ⅱ上,開放測試達到瞭93.31%/93.04%的查全率/準確率,極為接近國際最優水平.這既證明瞭此算法的行之有效,又錶明該方法的語言無關性.
사용료기우최대적적방법식별중문기본명사단어.재개방어료Chinese TreeBank상,지사용사성표주,체도료평균87.43%/88.09%적사전솔/준학솔.유우,관우중문적기본명사단어식별적결과몰유흔호적가비성,우사용상동적산법,상시료영문적기본명사단어식별.재영문표준어료TREEBANK Ⅱ상,개방측시체도료93.31%/93.04%적사전솔/준학솔,겁위접근국제최우수평.저기증명료차산법적행지유효,우표명해방법적어언무관성.