情报学报
情報學報
정보학보
2004年
4期
399-403
,共5页
蔡巍%王永成%尹中航%李伟
蔡巍%王永成%尹中航%李偉
채외%왕영성%윤중항%리위
自动分类%知识库%降噪%自然语言处理
自動分類%知識庫%降譟%自然語言處理
자동분류%지식고%강조%자연어언처리
本文着重研究了自动分类知识库中因为样本兼类而引起的存在于概念类频中的噪声,提出了借助于统计特性来修正概念类频的算法.在进行理论分析的基础上,本文讨论了算法的实现步骤,并通过对新闻语料的分类实验,检验了降噪效果.实验显示,本方法可以减少兼类概念在知识库中的冗余次数,提高自动分类系统的性能指标.
本文著重研究瞭自動分類知識庫中因為樣本兼類而引起的存在于概唸類頻中的譟聲,提齣瞭藉助于統計特性來脩正概唸類頻的算法.在進行理論分析的基礎上,本文討論瞭算法的實現步驟,併通過對新聞語料的分類實驗,檢驗瞭降譟效果.實驗顯示,本方法可以減少兼類概唸在知識庫中的冗餘次數,提高自動分類繫統的性能指標.
본문착중연구료자동분류지식고중인위양본겸류이인기적존재우개념류빈중적조성,제출료차조우통계특성래수정개념류빈적산법.재진행이론분석적기출상,본문토론료산법적실현보취,병통과대신문어료적분류실험,검험료강조효과.실험현시,본방법가이감소겸류개념재지식고중적용여차수,제고자동분류계통적성능지표.