计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2013年
11期
228-230,247
,共4页
强保华%李巍%邹显春%汪天天%吴春明
彊保華%李巍%鄒顯春%汪天天%吳春明
강보화%리외%추현춘%왕천천%오춘명
潜在语义分析%奇异值分解%Deep Web%查询接口聚类
潛在語義分析%奇異值分解%Deep Web%查詢接口聚類
잠재어의분석%기이치분해%Deep Web%사순접구취류
Latent semantic analysis%Singular value decomposition%Deep Web%Query interface clustering
集成查询接口的生成是Deep Web数据集成的重要组成环节.如何对不同领域的查询接口进行有效的聚类是生成集成查询接口时需要解决的核心问题之一.针对传统的向量空间模型在Deep Web查询接口聚类时单纯依赖关键词匹配的缺点,引入潜在语义分析(LSA)的方法来发掘查询接口之间的语义关系,并给出了基于潜在语义分析的Deep Web查询接口聚类算法,最后采用UIUC的Web集成资源库提供的数据进行了实验.结果表明,潜在语义分析的方法提高了同一领域查询接口之间的相似度,明显改善了Deep Web查询接口聚类的质量.
集成查詢接口的生成是Deep Web數據集成的重要組成環節.如何對不同領域的查詢接口進行有效的聚類是生成集成查詢接口時需要解決的覈心問題之一.針對傳統的嚮量空間模型在Deep Web查詢接口聚類時單純依賴關鍵詞匹配的缺點,引入潛在語義分析(LSA)的方法來髮掘查詢接口之間的語義關繫,併給齣瞭基于潛在語義分析的Deep Web查詢接口聚類算法,最後採用UIUC的Web集成資源庫提供的數據進行瞭實驗.結果錶明,潛在語義分析的方法提高瞭同一領域查詢接口之間的相似度,明顯改善瞭Deep Web查詢接口聚類的質量.
집성사순접구적생성시Deep Web수거집성적중요조성배절.여하대불동영역적사순접구진행유효적취류시생성집성사순접구시수요해결적핵심문제지일.침대전통적향량공간모형재Deep Web사순접구취류시단순의뢰관건사필배적결점,인입잠재어의분석(LSA)적방법래발굴사순접구지간적어의관계,병급출료기우잠재어의분석적Deep Web사순접구취류산법,최후채용UIUC적Web집성자원고제공적수거진행료실험.결과표명,잠재어의분석적방법제고료동일영역사순접구지간적상사도,명현개선료Deep Web사순접구취류적질량.