中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2012年
2期
69-74
,共6页
刘友强%李斌%奚宁%陈家骏
劉友彊%李斌%奚寧%陳傢駿
류우강%리빈%해저%진가준
缩略语%平行语料库%短语抽取%分类
縮略語%平行語料庫%短語抽取%分類
축략어%평행어료고%단어추취%분류
汉语缩略语在现代汉语中被广泛使用,其研究对于中文信息处理有着重要地意义.该文提出了一种从英汉平行语料库中自动提取汉语缩略语的方法.首先对双语语料进行词对齐,再抽取出与词对齐信息一致的双语短语对,然后用SVM分类器提取出质量高的双语短语对,最后再从质量高的短语对集合中利用相同英文及少量汉语缩略全称对应规则提取出汉语缩略语及全称语对.实验结果表明,利用平行语料的双语对译信息,自动提取出的缩略语具有较高地准确率,可以作为一种自动获取缩略语词典的有效方法.
漢語縮略語在現代漢語中被廣汎使用,其研究對于中文信息處理有著重要地意義.該文提齣瞭一種從英漢平行語料庫中自動提取漢語縮略語的方法.首先對雙語語料進行詞對齊,再抽取齣與詞對齊信息一緻的雙語短語對,然後用SVM分類器提取齣質量高的雙語短語對,最後再從質量高的短語對集閤中利用相同英文及少量漢語縮略全稱對應規則提取齣漢語縮略語及全稱語對.實驗結果錶明,利用平行語料的雙語對譯信息,自動提取齣的縮略語具有較高地準確率,可以作為一種自動穫取縮略語詞典的有效方法.
한어축략어재현대한어중피엄범사용,기연구대우중문신식처리유착중요지의의.해문제출료일충종영한평행어료고중자동제취한어축략어적방법.수선대쌍어어료진행사대제,재추취출여사대제신식일치적쌍어단어대,연후용SVM분류기제취출질량고적쌍어단어대,최후재종질량고적단어대집합중이용상동영문급소량한어축략전칭대응규칙제취출한어축략어급전칭어대.실험결과표명,이용평행어료적쌍어대역신식,자동제취출적축략어구유교고지준학솔,가이작위일충자동획취축략어사전적유효방법.