计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2010年
5期
762-771
,共10页
不确定数据%分布式聚集%Top-k查询%过滤策略%传感器网络
不確定數據%分佈式聚集%Top-k查詢%過濾策略%傳感器網絡
불학정수거%분포식취집%Top-k사순%과려책략%전감기망락
不确定数据查询技术在军事、金融、电信等领域中起到了越来越重要的作用.不确定性数据在传感器网络、分布式Web Server及P2P系统等分布式系统中广泛存在.从这些系统中收集所有数据进行集中式查询将带来巨大的通信开销、时间延迟和存储代价.同时,由于不确定数据的特点,大多数集中式不确定查询算法在分布式环境下并不适用.给出不确定数据的最大值和Top-k聚集查询定义,并分别提出了基于过滤策略的分布式聚集算法.算法根据给出的3个过滤策略,利用数据的分布区间和概率进行筛选概率上限的计算,尽可能将不影响查询结果的数据抛弃.同时,算法以相对较小的代价归并保存并传输了计算最终查询结果所需要的"不可丢弃"数据.实验结果表明,在各类系统和数据条件下,过滤算法都能够正确地得到查询结果并显著降低系统的数据通信开销.
不確定數據查詢技術在軍事、金融、電信等領域中起到瞭越來越重要的作用.不確定性數據在傳感器網絡、分佈式Web Server及P2P繫統等分佈式繫統中廣汎存在.從這些繫統中收集所有數據進行集中式查詢將帶來巨大的通信開銷、時間延遲和存儲代價.同時,由于不確定數據的特點,大多數集中式不確定查詢算法在分佈式環境下併不適用.給齣不確定數據的最大值和Top-k聚集查詢定義,併分彆提齣瞭基于過濾策略的分佈式聚集算法.算法根據給齣的3箇過濾策略,利用數據的分佈區間和概率進行篩選概率上限的計算,儘可能將不影響查詢結果的數據拋棄.同時,算法以相對較小的代價歸併保存併傳輸瞭計算最終查詢結果所需要的"不可丟棄"數據.實驗結果錶明,在各類繫統和數據條件下,過濾算法都能夠正確地得到查詢結果併顯著降低繫統的數據通信開銷.
불학정수거사순기술재군사、금융、전신등영역중기도료월래월중요적작용.불학정성수거재전감기망락、분포식Web Server급P2P계통등분포식계통중엄범존재.종저사계통중수집소유수거진행집중식사순장대래거대적통신개소、시간연지화존저대개.동시,유우불학정수거적특점,대다수집중식불학정사순산법재분포식배경하병불괄용.급출불학정수거적최대치화Top-k취집사순정의,병분별제출료기우과려책략적분포식취집산법.산법근거급출적3개과려책략,이용수거적분포구간화개솔진행사선개솔상한적계산,진가능장불영향사순결과적수거포기.동시,산법이상대교소적대개귀병보존병전수료계산최종사순결과소수요적"불가주기"수거.실험결과표명,재각류계통화수거조건하,과려산법도능구정학지득도사순결과병현저강저계통적수거통신개소.