世界科技研究与发展
世界科技研究與髮展
세계과기연구여발전
WORLD SCI-TECH R & D
2011年
4期
574-577
,共4页
分词%统计%未登录词%未登录词碎片字典
分詞%統計%未登錄詞%未登錄詞碎片字典
분사%통계%미등록사%미등록사쇄편자전
介绍了一种基于统计和未登录词碎片字典的未登录词识别方法.该方法首先在基于分词的基础上对一篇文本进行统计识别未登录词,然后利用未登录词碎片字典识别未登录词.实验结果表明:该方法较已有的未登录词识别方法更适用于识别文本中不断涌现的新词,在未登录词的召回率和准确率性能指标上达到了较好的效果.
介紹瞭一種基于統計和未登錄詞碎片字典的未登錄詞識彆方法.該方法首先在基于分詞的基礎上對一篇文本進行統計識彆未登錄詞,然後利用未登錄詞碎片字典識彆未登錄詞.實驗結果錶明:該方法較已有的未登錄詞識彆方法更適用于識彆文本中不斷湧現的新詞,在未登錄詞的召迴率和準確率性能指標上達到瞭較好的效果.
개소료일충기우통계화미등록사쇄편자전적미등록사식별방법.해방법수선재기우분사적기출상대일편문본진행통계식별미등록사,연후이용미등록사쇄편자전식별미등록사.실험결과표명:해방법교이유적미등록사식별방법경괄용우식별문본중불단용현적신사,재미등록사적소회솔화준학솔성능지표상체도료교호적효과.