计算机工程与设计
計算機工程與設計
계산궤공정여설계
COMPUTER ENGINEERING AND DESIGN
2012年
7期
2864-2867
,共4页
概念图%概念术语%网络爬虫技术%潜在语义分析%特征项
概唸圖%概唸術語%網絡爬蟲技術%潛在語義分析%特徵項
개념도%개념술어%망락파충기술%잠재어의분석%특정항
概念图的构建是一项复杂的工程,在概念术语提取阶段往往需要领域专家花费大量时间手工完成.随着概念图在信息处理和知识管理系统中得到日益广泛的应用,仅仅依靠领域专家来手工提取概念术语生成概念图的办法已不能满足应用需求.基于此,提出结合网络爬虫技术和LSA的方法自动提取概念术语,生成概念图的方法,可以降低概念图制作的人工复杂度,高效、准确的构建概念图,可以大大扩展概念图的应用范围.从指定网站上爬取大量领域文本资源;进行文本预处理并抽取特征项;再利用LSA挖掘特征项与特征项、特征项与文本之间的潜在语义结构,消除噪音及冗余特征项,提取概念术语.实验结果表明,结合网络爬虫技术和LSA方法能够降低概念术语的提取过程中的人力复杂度,去除冗余概念,并提高准确性.
概唸圖的構建是一項複雜的工程,在概唸術語提取階段往往需要領域專傢花費大量時間手工完成.隨著概唸圖在信息處理和知識管理繫統中得到日益廣汎的應用,僅僅依靠領域專傢來手工提取概唸術語生成概唸圖的辦法已不能滿足應用需求.基于此,提齣結閤網絡爬蟲技術和LSA的方法自動提取概唸術語,生成概唸圖的方法,可以降低概唸圖製作的人工複雜度,高效、準確的構建概唸圖,可以大大擴展概唸圖的應用範圍.從指定網站上爬取大量領域文本資源;進行文本預處理併抽取特徵項;再利用LSA挖掘特徵項與特徵項、特徵項與文本之間的潛在語義結構,消除譟音及冗餘特徵項,提取概唸術語.實驗結果錶明,結閤網絡爬蟲技術和LSA方法能夠降低概唸術語的提取過程中的人力複雜度,去除冗餘概唸,併提高準確性.
개념도적구건시일항복잡적공정,재개념술어제취계단왕왕수요영역전가화비대량시간수공완성.수착개념도재신식처리화지식관리계통중득도일익엄범적응용,부부의고영역전가래수공제취개념술어생성개념도적판법이불능만족응용수구.기우차,제출결합망락파충기술화LSA적방법자동제취개념술어,생성개념도적방법,가이강저개념도제작적인공복잡도,고효、준학적구건개념도,가이대대확전개념도적응용범위.종지정망참상파취대량영역문본자원;진행문본예처리병추취특정항;재이용LSA알굴특정항여특정항、특정항여문본지간적잠재어의결구,소제조음급용여특정항,제취개념술어.실험결과표명,결합망락파충기술화LSA방법능구강저개념술어적제취과정중적인력복잡도,거제용여개념,병제고준학성.