电子科技大学学报
電子科技大學學報
전자과기대학학보
JOURNAL OF UNIVERSITY OF ELECTRONIC SCIENCE AND TECHNOLOGY OF CHINA
2014年
6期
893-897
,共5页
不对称性%描述蕴含%模糊偏序关系%支持度模型%真值发现
不對稱性%描述蘊含%模糊偏序關繫%支持度模型%真值髮現
불대칭성%묘술온함%모호편서관계%지지도모형%진치발현
asymmetry%description containing%fuzzy partial order relations%support degree calculation model%true value finding algorithm
为了解决主数据集成、web数据集成中的真值发现问题,提出了一种基于模糊偏序关系支持度计算模型的真值发现算法(FA-SDCM)。针对已有算法中,以描述相似度替代描述支持度进行计算,忽视了描述所含真值信息的不对称性问题,在分析描述本身特性的基础上,提出了描述蕴含概念,定义了基于模糊偏序关系的支持度计算模型,较好地解决了描述所含真值信息的不对称性问题。在考虑了数据源可信度及描述之间支持度对真值发现影响的基础上,基于迭代思想,提出了FA-SDCM算法。在Books-Authors数据集上进行实验,结果表明FA-SDCM算法比Vot e算法与TruthFinder算法具有更高的准确率。
為瞭解決主數據集成、web數據集成中的真值髮現問題,提齣瞭一種基于模糊偏序關繫支持度計算模型的真值髮現算法(FA-SDCM)。針對已有算法中,以描述相似度替代描述支持度進行計算,忽視瞭描述所含真值信息的不對稱性問題,在分析描述本身特性的基礎上,提齣瞭描述蘊含概唸,定義瞭基于模糊偏序關繫的支持度計算模型,較好地解決瞭描述所含真值信息的不對稱性問題。在攷慮瞭數據源可信度及描述之間支持度對真值髮現影響的基礎上,基于迭代思想,提齣瞭FA-SDCM算法。在Books-Authors數據集上進行實驗,結果錶明FA-SDCM算法比Vot e算法與TruthFinder算法具有更高的準確率。
위료해결주수거집성、web수거집성중적진치발현문제,제출료일충기우모호편서관계지지도계산모형적진치발현산법(FA-SDCM)。침대이유산법중,이묘술상사도체대묘술지지도진행계산,홀시료묘술소함진치신식적불대칭성문제,재분석묘술본신특성적기출상,제출료묘술온함개념,정의료기우모호편서관계적지지도계산모형,교호지해결료묘술소함진치신식적불대칭성문제。재고필료수거원가신도급묘술지간지지도대진치발현영향적기출상,기우질대사상,제출료FA-SDCM산법。재Books-Authors수거집상진행실험,결과표명FA-SDCM산법비Vot e산법여TruthFinder산법구유경고적준학솔。
In order to find the true values in master data integration and web data integration, we propose a true value finding algorithm (FA-SDCM) based on a support degree calculation model using fuzzy partial order relations. In existing algorithms, support degrees are usually substituted by similarity, which ignores the asymmetry in the true vales. In this paper, the concept of description containing is proposed through analyzing characteristics of descriptions, and then a support degree calculating model is developed based on fuzzy partial order relations to solve the description of asymmetric problems in the true values. Considering the influence of the data source reliability and the support degrees among descriptions on true value finding, the FA-SDCM algorithm is realized iteratively. An experiment has been carried on the Books-Authors data set, and the result shows that the FA-SDCM algorithm has better accuracy than the Vote and the TruthFinder algorithms.