软件学报
軟件學報
연건학보
JOURNAL OF SOFTWARE
2009年
4期
918-929
,共12页
吴爱华%王先胜%谈子敬%汪卫
吳愛華%王先勝%談子敬%汪衛
오애화%왕선성%담자경%왕위
不一致性%不一致数据%修复%一致的查询回答%XML数据清洗%不完整数据库
不一緻性%不一緻數據%脩複%一緻的查詢迴答%XML數據清洗%不完整數據庫
불일치성%불일치수거%수복%일치적사순회답%XML수거청세%불완정수거고
在实际应用中,为不一致的XML文档计算最优修复意义重大.但求解最优修复是一个NP完全问题,特别是在XML文档同时违反函数依赖约束和主键约束时.提出一个基于代价模型的、可以在多项式时间内完成的启发式修复求解算法.该算法首先借助索引表,在一遍扫描原始XML文档的情况下寻找不一致数据集,然后为每一类约束的不一致数据集构造候选修复,同时计算其修复代价,最后启发式地求解一个代价最小的修复方案.实验结果表明,该算法的时间复杂度不超过冲突类的3次方,即便是在不一致数据量很大,噪声比例很大以及涉及多类语义约束时,也能较快地完成修复.
在實際應用中,為不一緻的XML文檔計算最優脩複意義重大.但求解最優脩複是一箇NP完全問題,特彆是在XML文檔同時違反函數依賴約束和主鍵約束時.提齣一箇基于代價模型的、可以在多項式時間內完成的啟髮式脩複求解算法.該算法首先藉助索引錶,在一遍掃描原始XML文檔的情況下尋找不一緻數據集,然後為每一類約束的不一緻數據集構造候選脩複,同時計算其脩複代價,最後啟髮式地求解一箇代價最小的脩複方案.實驗結果錶明,該算法的時間複雜度不超過遲突類的3次方,即便是在不一緻數據量很大,譟聲比例很大以及涉及多類語義約束時,也能較快地完成脩複.
재실제응용중,위불일치적XML문당계산최우수복의의중대.단구해최우수복시일개NP완전문제,특별시재XML문당동시위반함수의뢰약속화주건약속시.제출일개기우대개모형적、가이재다항식시간내완성적계발식수복구해산법.해산법수선차조색인표,재일편소묘원시XML문당적정황하심조불일치수거집,연후위매일류약속적불일치수거집구조후선수복,동시계산기수복대개,최후계발식지구해일개대개최소적수복방안.실험결과표명,해산법적시간복잡도불초과충돌류적3차방,즉편시재불일치수거량흔대,조성비례흔대이급섭급다류어의약속시,야능교쾌지완성수복.