计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2014年
8期
85-89
,共5页
黄冬梅%冯恺%赵丹枫%郭颖新
黃鼕梅%馮愷%趙丹楓%郭穎新
황동매%풍개%조단풍%곽영신
不确定性%模式匹配%条件互信息
不確定性%模式匹配%條件互信息
불학정성%모식필배%조건호신식
Uncertainty%Schema matching%Conditional mutual information
模式匹配是数据集成领域的一个重要研究内容,列名与数据值不确定是模式匹配中的一种常见情况,当前较普遍的方法是基于互信息及欧式空间距离.但该方法没有解决因属性相似度相同或相近而引起的错误匹配问题.针对该问题,提出了多重迭代筛选方法,首先确定两个关系模式中能一次性正确匹配的部分属性对,再从中求出最优属性对,然后给出基于条件互信息的匹配方法,利用最优属性对计算未匹配属性的条件互信息,进一步计算各属性之间的欧氏距离,最终得到匹配结果,从而解决了错误匹配问题.实验结果表明所提算法正确、有效.
模式匹配是數據集成領域的一箇重要研究內容,列名與數據值不確定是模式匹配中的一種常見情況,噹前較普遍的方法是基于互信息及歐式空間距離.但該方法沒有解決因屬性相似度相同或相近而引起的錯誤匹配問題.針對該問題,提齣瞭多重迭代篩選方法,首先確定兩箇關繫模式中能一次性正確匹配的部分屬性對,再從中求齣最優屬性對,然後給齣基于條件互信息的匹配方法,利用最優屬性對計算未匹配屬性的條件互信息,進一步計算各屬性之間的歐氏距離,最終得到匹配結果,從而解決瞭錯誤匹配問題.實驗結果錶明所提算法正確、有效.
모식필배시수거집성영역적일개중요연구내용,렬명여수거치불학정시모식필배중적일충상견정황,당전교보편적방법시기우호신식급구식공간거리.단해방법몰유해결인속성상사도상동혹상근이인기적착오필배문제.침대해문제,제출료다중질대사선방법,수선학정량개관계모식중능일차성정학필배적부분속성대,재종중구출최우속성대,연후급출기우조건호신식적필배방법,이용최우속성대계산미필배속성적조건호신식,진일보계산각속성지간적구씨거리,최종득도필배결과,종이해결료착오필배문제.실험결과표명소제산법정학、유효.