计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2004年
30期
178-180,220
,共4页
搜索引擎%文本聚类%episode%信息抽取%知识发现
搜索引擎%文本聚類%episode%信息抽取%知識髮現
수색인경%문본취류%episode%신식추취%지식발현
数据挖掘一般用于高度结构化的大型数据库,以发现其中所蕴含的知识.随着在线文本的增多,其中所蕴含的知识也越来越丰富,但是,它们却难以被分析利用.因而,研究一套行之有效的方案发现文本中所蕴含的知识是非常重要的,也是当前重要的研究课题.该文利用搜索引擎Google获取相关Web页面,进行过滤和清洗后得到相关文本,然后,进行文本聚类,利用Episode进行事件识别和信息抽取,数据集成及数据挖掘,从而实现知识发现.最后给出了原型系统,对知识发现进行实践检验,收到了很好的效果.
數據挖掘一般用于高度結構化的大型數據庫,以髮現其中所蘊含的知識.隨著在線文本的增多,其中所蘊含的知識也越來越豐富,但是,它們卻難以被分析利用.因而,研究一套行之有效的方案髮現文本中所蘊含的知識是非常重要的,也是噹前重要的研究課題.該文利用搜索引擎Google穫取相關Web頁麵,進行過濾和清洗後得到相關文本,然後,進行文本聚類,利用Episode進行事件識彆和信息抽取,數據集成及數據挖掘,從而實現知識髮現.最後給齣瞭原型繫統,對知識髮現進行實踐檢驗,收到瞭很好的效果.
수거알굴일반용우고도결구화적대형수거고,이발현기중소온함적지식.수착재선문본적증다,기중소온함적지식야월래월봉부,단시,타문각난이피분석이용.인이,연구일투행지유효적방안발현문본중소온함적지식시비상중요적,야시당전중요적연구과제.해문이용수색인경Google획취상관Web혈면,진행과려화청세후득도상관문본,연후,진행문본취류,이용Episode진행사건식별화신식추취,수거집성급수거알굴,종이실현지식발현.최후급출료원형계통,대지식발현진행실천검험,수도료흔호적효과.