太原理工大学学报
太原理工大學學報
태원리공대학학보
JOURNAL OF TAIYUAN UNIVERSITY OF TECHNOLOGY
2006年
2期
165-168
,共4页
Web文本信息%特定领域%分类系统%中文分词
Web文本信息%特定領域%分類繫統%中文分詞
Web문본신식%특정영역%분류계통%중문분사
从特定领域用户获取Web文本信息的实际应用角度出发,在分析了系统相关开发理论基础上,通过从内容和语义上指导Web信息的搜索,尝试设计了一个基于特定领域的Web文本信息获取系统模型,并从实现技术上提出了开发这个系统的体系结构,分析了各组成模块的主要特点及其功能.着重研究了该系统的几项关键技术:Robot技术、Web页面内容的分析和站点结构的分析技术、中文文本的分类问题,包括中文的分词、特征提取、特征匹配及权值计算等的综合应用技术.
從特定領域用戶穫取Web文本信息的實際應用角度齣髮,在分析瞭繫統相關開髮理論基礎上,通過從內容和語義上指導Web信息的搜索,嘗試設計瞭一箇基于特定領域的Web文本信息穫取繫統模型,併從實現技術上提齣瞭開髮這箇繫統的體繫結構,分析瞭各組成模塊的主要特點及其功能.著重研究瞭該繫統的幾項關鍵技術:Robot技術、Web頁麵內容的分析和站點結構的分析技術、中文文本的分類問題,包括中文的分詞、特徵提取、特徵匹配及權值計算等的綜閤應用技術.
종특정영역용호획취Web문본신식적실제응용각도출발,재분석료계통상관개발이론기출상,통과종내용화어의상지도Web신식적수색,상시설계료일개기우특정영역적Web문본신식획취계통모형,병종실현기술상제출료개발저개계통적체계결구,분석료각조성모괴적주요특점급기공능.착중연구료해계통적궤항관건기술:Robot기술、Web혈면내용적분석화참점결구적분석기술、중문문본적분류문제,포괄중문적분사、특정제취、특정필배급권치계산등적종합응용기술.