计算机科学与探索
計算機科學與探索
계산궤과학여탐색
JOURNAL OF FRONTIERS OF COMPUTER SCIENCE & TECHNOLOGY
2013年
5期
460-471
,共12页
朱运磊%岳昆%钱文华%杨文静%刘惟一
硃運磊%嶽昆%錢文華%楊文靜%劉惟一
주운뢰%악곤%전문화%양문정%류유일
不确定性数据%世系表示%概率图模型%贝叶斯网%时序多层概率图模型
不確定性數據%世繫錶示%概率圖模型%貝葉斯網%時序多層概率圖模型
불학정성수거%세계표시%개솔도모형%패협사망%시서다층개솔도모형
uncertain data%lineage representation%probabilistic graphical model (PGM)%Bayesian network (BN)%time-series multi-level probabilistic graphical model
不确定性数据世系分析需要追踪随时间推移数据产生和演化过程中不确定性的起源,为了有效地反映世系本身的时序特征和数据演化过程,并支持世系分析中的概率推理和不确定性追踪,针对不确定性数据查询处理的世系表示,以贝叶斯网这一重要的概率图模型作为不确定性知识表示的框架,并基于世系的时序性和层次性对其进行了扩展.以世系的布尔公式表达式为出发点,提出了涉及连续时间片的时序多层概率图模型的概念,给出了时间片内和连续时间片间贝叶斯网结构的构建方法,以及网络中各结点概率参数的计算方法,旨在为世系分析奠定模型基础.实验结果表明,该世系表示方法是有效、实用的.
不確定性數據世繫分析需要追蹤隨時間推移數據產生和縯化過程中不確定性的起源,為瞭有效地反映世繫本身的時序特徵和數據縯化過程,併支持世繫分析中的概率推理和不確定性追蹤,針對不確定性數據查詢處理的世繫錶示,以貝葉斯網這一重要的概率圖模型作為不確定性知識錶示的框架,併基于世繫的時序性和層次性對其進行瞭擴展.以世繫的佈爾公式錶達式為齣髮點,提齣瞭涉及連續時間片的時序多層概率圖模型的概唸,給齣瞭時間片內和連續時間片間貝葉斯網結構的構建方法,以及網絡中各結點概率參數的計算方法,旨在為世繫分析奠定模型基礎.實驗結果錶明,該世繫錶示方法是有效、實用的.
불학정성수거세계분석수요추종수시간추이수거산생화연화과정중불학정성적기원,위료유효지반영세계본신적시서특정화수거연화과정,병지지세계분석중적개솔추리화불학정성추종,침대불학정성수거사순처리적세계표시,이패협사망저일중요적개솔도모형작위불학정성지식표시적광가,병기우세계적시서성화층차성대기진행료확전.이세계적포이공식표체식위출발점,제출료섭급련속시간편적시서다층개솔도모형적개념,급출료시간편내화련속시간편간패협사망결구적구건방법,이급망락중각결점개솔삼수적계산방법,지재위세계분석전정모형기출.실험결과표명,해세계표시방법시유효、실용적.
@@@@Lineage analysis over uncertain data will trace the origin of uncertainty of data production and evolution with time passing. In order to reflect the inherent time-series property and the process of data evolution, and support probability inferences and uncertainty tracing in lineage analysis, this paper considers the lineages representation of query processing over uncertain data and adopts Bayesian network (BN), an important probabilistic graphical model (PGM), as the framework for uncertainty representation. Specifically, it extends BN by incorporating the time-series and multi-level properties. To provide the basis of lineage analysis models, this paper starts from the Boolean formulas for describing query processing, and proposes the concept of time-series multi-level probabilistic graphical model, then gives the corresponding method for constructing BN structures in separate time slices and those between adjacent time slices, as well as the method for computing probability parameters of nodes. Experimental results show that the proposed method for lineage representation is effective and applicable.