中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2012年
2期
62-68
,共7页
缩略语%CRF模型%网页数据
縮略語%CRF模型%網頁數據
축략어%CRF모형%망혈수거
缩略语在自然语言中被广泛使用.因其是新词的重要来源之一,成为了自然语言处理领域的一大问题.该文以汉语为对象,研究了从完整形式预测缩略语形式的方法.首先,使用条件随机场模型对完整形式进行序列标注,生成缩略语候选集合.再利用搜索引擎获取网络数据,并通过不同策略利用网络数据对各候选依次评估,结 合各项评估分数进行重排序,选择最终的缩略语结果.实验结果表明,增加Web信息之后,缩略语预测的准确率可以提高约五个百分点.
縮略語在自然語言中被廣汎使用.因其是新詞的重要來源之一,成為瞭自然語言處理領域的一大問題.該文以漢語為對象,研究瞭從完整形式預測縮略語形式的方法.首先,使用條件隨機場模型對完整形式進行序列標註,生成縮略語候選集閤.再利用搜索引擎穫取網絡數據,併通過不同策略利用網絡數據對各候選依次評估,結 閤各項評估分數進行重排序,選擇最終的縮略語結果.實驗結果錶明,增加Web信息之後,縮略語預測的準確率可以提高約五箇百分點.
축략어재자연어언중피엄범사용.인기시신사적중요래원지일,성위료자연어언처리영역적일대문제.해문이한어위대상,연구료종완정형식예측축략어형식적방법.수선,사용조건수궤장모형대완정형식진행서렬표주,생성축략어후선집합.재이용수색인경획취망락수거,병통과불동책략이용망락수거대각후선의차평고,결 합각항평고분수진행중배서,선택최종적축략어결과.실험결과표명,증가Web신식지후,축략어예측적준학솔가이제고약오개백분점.