计算机技术与发展
計算機技術與髮展
계산궤기술여발전
COMPUTER TECHNOLOGY AND DEVELOPMENT
2007年
12期
122-124,172
,共4页
中文分词%歧义消除%最大匹配%词语优化
中文分詞%歧義消除%最大匹配%詞語優化
중문분사%기의소제%최대필배%사어우화
文本挖掘是指使用数据挖掘技术,自动地从文本数据中发现和提取独立于用户信息需求的文档集中的隐含知识.而中文文本数据的获得是依靠中文信息处理技术来进行的,因而自动分词成为中文信息处理中的基础课题.对于海量信息处理的应用,分词的速度是极为重要的,对整个系统的效率有很大的影响.分析了几种常见的分词方法,设计了一个基于正向最大匹配法的中文自动分词系统.为了提高分词的精度,对加强歧义消除和词语优化的算法进行了研究处理.
文本挖掘是指使用數據挖掘技術,自動地從文本數據中髮現和提取獨立于用戶信息需求的文檔集中的隱含知識.而中文文本數據的穫得是依靠中文信息處理技術來進行的,因而自動分詞成為中文信息處理中的基礎課題.對于海量信息處理的應用,分詞的速度是極為重要的,對整箇繫統的效率有很大的影響.分析瞭幾種常見的分詞方法,設計瞭一箇基于正嚮最大匹配法的中文自動分詞繫統.為瞭提高分詞的精度,對加彊歧義消除和詞語優化的算法進行瞭研究處理.
문본알굴시지사용수거알굴기술,자동지종문본수거중발현화제취독립우용호신식수구적문당집중적은함지식.이중문문본수거적획득시의고중문신식처리기술래진행적,인이자동분사성위중문신식처리중적기출과제.대우해량신식처리적응용,분사적속도시겁위중요적,대정개계통적효솔유흔대적영향.분석료궤충상견적분사방법,설계료일개기우정향최대필배법적중문자동분사계통.위료제고분사적정도,대가강기의소제화사어우화적산법진행료연구처리.