计算机学报
計算機學報
계산궤학보
CHINESE JOURNAL OF COMPUTERS
2011年
10期
1863-1875
,共13页
王黎维%鲍芝峰%KOEHLERHenning%周晓方%SADIQShazia
王黎維%鮑芝峰%KOEHLERHenning%週曉方%SADIQShazia
왕려유%포지봉%KOEHLERHenning%주효방%SADIQShazia
溯源树%溯源表%存储优化%最优削剪%规则I&II削剪
溯源樹%溯源錶%存儲優化%最優削剪%規則I&II削剪
소원수%소원표%존저우화%최우삭전%규칙I&II삭전
现代数据管理必须处理来源不同、质量各异的数据,因此从系统层面支持数据溯源,让用户了解数据的来源及派生过程成为当前至关重要的一个研究课题.基于标注的方法是支持数据溯源的基本方法之一.这种方法的主要问题是存储空间开销,因为溯源信息可能会超过实际数据的大小.在该文中,作者提出了一个用与查询结构匹配的溯源树来表达和存储溯源信息从而避免数据派生过程中冗余存储的基本框架.基于这个框架,作者提出了一系列针对关系型查询的存储优化方法,选择查询树部分节点来存储溯源信息.这些优化算法对于查询大小是多项式时间,对于溯源信息大小是线性时间,在溯源信息的跟踪和优化方面均不会产生巨大的开销.这一框架是数据溯源研究的一个新思路,有着广泛的应用前景.
現代數據管理必鬚處理來源不同、質量各異的數據,因此從繫統層麵支持數據溯源,讓用戶瞭解數據的來源及派生過程成為噹前至關重要的一箇研究課題.基于標註的方法是支持數據溯源的基本方法之一.這種方法的主要問題是存儲空間開銷,因為溯源信息可能會超過實際數據的大小.在該文中,作者提齣瞭一箇用與查詢結構匹配的溯源樹來錶達和存儲溯源信息從而避免數據派生過程中冗餘存儲的基本框架.基于這箇框架,作者提齣瞭一繫列針對關繫型查詢的存儲優化方法,選擇查詢樹部分節點來存儲溯源信息.這些優化算法對于查詢大小是多項式時間,對于溯源信息大小是線性時間,在溯源信息的跟蹤和優化方麵均不會產生巨大的開銷.這一框架是數據溯源研究的一箇新思路,有著廣汎的應用前景.
현대수거관리필수처리래원불동、질량각이적수거,인차종계통층면지지수거소원,양용호료해수거적래원급파생과정성위당전지관중요적일개연구과제.기우표주적방법시지지수거소원적기본방법지일.저충방법적주요문제시존저공간개소,인위소원신식가능회초과실제수거적대소.재해문중,작자제출료일개용여사순결구필배적소원수래표체화존저소원신식종이피면수거파생과정중용여존저적기본광가.기우저개광가,작자제출료일계렬침대관계형사순적존저우화방법,선택사순수부분절점래존저소원신식.저사우화산법대우사순대소시다항식시간,대우소원신식대소시선성시간,재소원신식적근종화우화방면균불회산생거대적개소.저일광가시수거소원연구적일개신사로,유착엄범적응용전경.