计算机应用研究
計算機應用研究
계산궤응용연구
APPLICATION RESEARCH OF COMPUTERS
2012年
3期
916-918
,共3页
周晓庆%肖顺文%肖建琼%罗兴贤
週曉慶%肖順文%肖建瓊%囉興賢
주효경%초순문%초건경%라흥현
Web数据库%特征提取%特征估价%Na(i)ve Bayes分类器
Web數據庫%特徵提取%特徵估價%Na(i)ve Bayes分類器
Web수거고%특정제취%특정고개%Na(i)ve Bayes분류기
针对传统的搜索引擎无法正确搜索到Deep Web中隐藏的海量信息,对Web数据库的分类是通向Web数据库分类集成和检索的关键步骤.提出了一种基于权值调整技术的Deep Web数据库分类方法,首先从网页表单中提取特征;然后对这些特征使用一种新的权重计算方法进行估值;最后利用朴素贝叶斯分类器对Web数据库进行分类.实验表明,这种分类方法经过少量样本训练后,就能达到很好的分类效果,并且随着训练样本的增加,该分类器的性能保持稳定,准确率、召回率都在很小的范围内波动.
針對傳統的搜索引擎無法正確搜索到Deep Web中隱藏的海量信息,對Web數據庫的分類是通嚮Web數據庫分類集成和檢索的關鍵步驟.提齣瞭一種基于權值調整技術的Deep Web數據庫分類方法,首先從網頁錶單中提取特徵;然後對這些特徵使用一種新的權重計算方法進行估值;最後利用樸素貝葉斯分類器對Web數據庫進行分類.實驗錶明,這種分類方法經過少量樣本訓練後,就能達到很好的分類效果,併且隨著訓練樣本的增加,該分類器的性能保持穩定,準確率、召迴率都在很小的範圍內波動.
침대전통적수색인경무법정학수색도Deep Web중은장적해량신식,대Web수거고적분류시통향Web수거고분류집성화검색적관건보취.제출료일충기우권치조정기술적Deep Web수거고분류방법,수선종망혈표단중제취특정;연후대저사특정사용일충신적권중계산방법진행고치;최후이용박소패협사분류기대Web수거고진행분류.실험표명,저충분류방법경과소량양본훈련후,취능체도흔호적분류효과,병차수착훈련양본적증가,해분류기적성능보지은정,준학솔、소회솔도재흔소적범위내파동.