计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2001年
10期
1-3
,共3页
特征提取信息检索全球网
特徵提取信息檢索全毬網
특정제취신식검색전구망
文章主要研究基于内容的中文网页的特征提取技术,具体介绍了分词词典的建造方法,网页正文、标记信息和超链信息的特征提取。通过对旅游类网页的实验结果显示,文中的方法和应用效果良好。
文章主要研究基于內容的中文網頁的特徵提取技術,具體介紹瞭分詞詞典的建造方法,網頁正文、標記信息和超鏈信息的特徵提取。通過對旅遊類網頁的實驗結果顯示,文中的方法和應用效果良好。
문장주요연구기우내용적중문망혈적특정제취기술,구체개소료분사사전적건조방법,망혈정문、표기신식화초련신식적특정제취。통과대여유류망혈적실험결과현시,문중적방법화응용효과량호。
This paper presents a feature framework for content-based Chinese web page analysis and searching. The method for constructing segmentation keyword dictionary is introduced first. The keywords in the dictionary are these words that represent the contents and concepts of a certain are web pages. Then,feature extraction methods for text,tag information and hyperlink information are addressed. Experiments have shown that the proposed methods tested on Chinese travel web pages are worked very well.