现代图书情报技术
現代圖書情報技術
현대도서정보기술
NEW TECHNOLOGY OF LIBRARY AND INFORMATION SERVICE
2007年
1期
37-39
,共3页
吕学强%黄河%李渝勤%施水才
呂學彊%黃河%李渝勤%施水纔
려학강%황하%리투근%시수재
自动挖掘%新词语%统计%规则
自動挖掘%新詞語%統計%規則
자동알굴%신사어%통계%규칙
针对从BBS文本中自动挖掘新词语的问题,提出一种结合统计和规则的简单易行的方法,采用中文分词、频数统计、词性过滤、词语碎片组合等关键技术.据此方法开发的系统可以自动挖掘不限长度、不限领域、不限类别的与上下文无关的任意新词语.
針對從BBS文本中自動挖掘新詞語的問題,提齣一種結閤統計和規則的簡單易行的方法,採用中文分詞、頻數統計、詞性過濾、詞語碎片組閤等關鍵技術.據此方法開髮的繫統可以自動挖掘不限長度、不限領域、不限類彆的與上下文無關的任意新詞語.
침대종BBS문본중자동알굴신사어적문제,제출일충결합통계화규칙적간단역행적방법,채용중문분사、빈수통계、사성과려、사어쇄편조합등관건기술.거차방법개발적계통가이자동알굴불한장도、불한영역、불한유별적여상하문무관적임의신사어.