广西师范大学学报(自然科学版)
廣西師範大學學報(自然科學版)
엄서사범대학학보(자연과학판)
JOURNAL OF GUANGXI NORMAL UNIVERSITY(NATURAL SCIENCE EDITION)
2008年
3期
141-146
,共6页
新闻网页%特征提取%分类%自动识别
新聞網頁%特徵提取%分類%自動識彆
신문망혈%특정제취%분류%자동식별
因特网包含着内容广泛、形式各异的信息资源.新闻网页的过滤、摘要和分类已经成为当今的研究热点,因此,如何准确地识别出新闻网页成为迫切需要解决的问题.在研究典型新闻网页特征的基础上,提出一种面向新闻网页自动识别的网页特征集,并采用三种不同的分类算法构建分类器.实验结果表明,在本文所提出的新闻网页特征集的基础上构建的分类器能很好的识别新闻网页.
因特網包含著內容廣汎、形式各異的信息資源.新聞網頁的過濾、摘要和分類已經成為噹今的研究熱點,因此,如何準確地識彆齣新聞網頁成為迫切需要解決的問題.在研究典型新聞網頁特徵的基礎上,提齣一種麵嚮新聞網頁自動識彆的網頁特徵集,併採用三種不同的分類算法構建分類器.實驗結果錶明,在本文所提齣的新聞網頁特徵集的基礎上構建的分類器能很好的識彆新聞網頁.
인특망포함착내용엄범、형식각이적신식자원.신문망혈적과려、적요화분류이경성위당금적연구열점,인차,여하준학지식별출신문망혈성위박절수요해결적문제.재연구전형신문망혈특정적기출상,제출일충면향신문망혈자동식별적망혈특정집,병채용삼충불동적분류산법구건분류기.실험결과표명,재본문소제출적신문망혈특정집적기출상구건적분류기능흔호적식별신문망혈.