电脑开发与应用
電腦開髮與應用
전뇌개발여응용
COMPUTER DEVELOPMENT & APPLICATIONS
2015年
1期
25-28
,共4页
常凯敏%张岩%王洪飞%于孟喜
常凱敏%張巖%王洪飛%于孟喜
상개민%장암%왕홍비%우맹희
聚类%信息熵%邻近算法
聚類%信息熵%鄰近算法
취류%신식적%린근산법
clustering%information entropy%nearest neighbor algorithm
聚类是Web数据管理领域的一个具有挑战性的课题。各种形式的聚类要求在大范围内得到应用,包括找到镜像网页,探测侵权行为,并以结构化方式展示搜索的结果。概述了实现聚类在WEB用户和WEB资源得以应用的最流行的方法,并提出了当前的应用状态和WEB领域将来的发展前景。
聚類是Web數據管理領域的一箇具有挑戰性的課題。各種形式的聚類要求在大範圍內得到應用,包括找到鏡像網頁,探測侵權行為,併以結構化方式展示搜索的結果。概述瞭實現聚類在WEB用戶和WEB資源得以應用的最流行的方法,併提齣瞭噹前的應用狀態和WEB領域將來的髮展前景。
취류시Web수거관리영역적일개구유도전성적과제。각충형식적취류요구재대범위내득도응용,포괄조도경상망혈,탐측침권행위,병이결구화방식전시수색적결과。개술료실현취류재WEB용호화WEB자원득이응용적최류행적방법,병제출료당전적응용상태화WEB영역장래적발전전경。
Clustering is a challenging topic in the area of Web data management. Various forms of clustering are required in a wide range of applications, including finding mirrored Web pages, detecting copyright violations, and reporting search results in a structured way. This paper presents an overview of the most popular methodologies and implementations in terms of clustering either Web users or Web sources and presents a survey about current status and future trends in clustering employed over the Web.