计算机工程与设计
計算機工程與設計
계산궤공정여설계
COMPUTER ENGINEERING AND DESIGN
2012年
1期
362-366
,共5页
外国译名%分词%共现字串%频率统计%译名边界%自然语言处理
外國譯名%分詞%共現字串%頻率統計%譯名邊界%自然語言處理
외국역명%분사%공현자천%빈솔통계%역명변계%자연어언처리
为了减少分词的负面效果,提出了基于用字共现频率统计的外国译名自动识别方法.对译名的用字特征进行了统计,提出译名共现字串的概念,并由译名用字表与汉语常用字表得到了非译名用字表.在上述工作的基础上定义了译名的边界,在边界定义的基础上设计了一种对分词错误的调整方法.对开放语料的测试结果表明,与最大词频分词算法相比,该算法在译名识别中的准确率、召回率、F值均有所提高.
為瞭減少分詞的負麵效果,提齣瞭基于用字共現頻率統計的外國譯名自動識彆方法.對譯名的用字特徵進行瞭統計,提齣譯名共現字串的概唸,併由譯名用字錶與漢語常用字錶得到瞭非譯名用字錶.在上述工作的基礎上定義瞭譯名的邊界,在邊界定義的基礎上設計瞭一種對分詞錯誤的調整方法.對開放語料的測試結果錶明,與最大詞頻分詞算法相比,該算法在譯名識彆中的準確率、召迴率、F值均有所提高.
위료감소분사적부면효과,제출료기우용자공현빈솔통계적외국역명자동식별방법.대역명적용자특정진행료통계,제출역명공현자천적개념,병유역명용자표여한어상용자표득도료비역명용자표.재상술공작적기출상정의료역명적변계,재변계정의적기출상설계료일충대분사착오적조정방법.대개방어료적측시결과표명,여최대사빈분사산법상비,해산법재역명식별중적준학솔、소회솔、F치균유소제고.