计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2004年
10期
1670-1676
,共7页
邹远娅%周皓峰%王晨%汪卫%施伯乐
鄒遠婭%週皓峰%王晨%汪衛%施伯樂
추원아%주호봉%왕신%왕위%시백악
视图估算%频繁项集%均匀分布%数据倾斜度
視圖估算%頻繁項集%均勻分佈%數據傾斜度
시도고산%빈번항집%균균분포%수거경사도
OLAP系统中经常要在大规模数据库上进行复杂查询.为了提高查询响应速度,往往要事先物化一些视图.在考虑选择物化哪些视图时,必须首先解决视图大小的估算问题.目前,对于视图大小的估算,主要有两种方法:一种是利用概率模型和数学估算的方法;另一种是假定数据符合某种特定的分布模型.通过采样确定模型的参数,并将其推广到整个数据集进行估算.提出了一种视图估算的新方法FSC,引入了频繁项集挖掘的思想,在扫描两次数据库后可以得到cube中所有视图大小的估算值.实验证明,与同类算法相比,FSC的精度有较大地提高,特别是针对倾斜度较大的数据集.
OLAP繫統中經常要在大規模數據庫上進行複雜查詢.為瞭提高查詢響應速度,往往要事先物化一些視圖.在攷慮選擇物化哪些視圖時,必鬚首先解決視圖大小的估算問題.目前,對于視圖大小的估算,主要有兩種方法:一種是利用概率模型和數學估算的方法;另一種是假定數據符閤某種特定的分佈模型.通過採樣確定模型的參數,併將其推廣到整箇數據集進行估算.提齣瞭一種視圖估算的新方法FSC,引入瞭頻繁項集挖掘的思想,在掃描兩次數據庫後可以得到cube中所有視圖大小的估算值.實驗證明,與同類算法相比,FSC的精度有較大地提高,特彆是針對傾斜度較大的數據集.
OLAP계통중경상요재대규모수거고상진행복잡사순.위료제고사순향응속도,왕왕요사선물화일사시도.재고필선택물화나사시도시,필수수선해결시도대소적고산문제.목전,대우시도대소적고산,주요유량충방법:일충시이용개솔모형화수학고산적방법;령일충시가정수거부합모충특정적분포모형.통과채양학정모형적삼수,병장기추엄도정개수거집진행고산.제출료일충시도고산적신방법FSC,인입료빈번항집알굴적사상,재소묘량차수거고후가이득도cube중소유시도대소적고산치.실험증명,여동류산법상비,FSC적정도유교대지제고,특별시침대경사도교대적수거집.