计算机学报
計算機學報
계산궤학보
CHINESE JOURNAL OF COMPUTERS
2011年
10期
1843-1852
,共10页
数据质量%复杂数据%实体识别%XML图%复杂网络
數據質量%複雜數據%實體識彆%XML圖%複雜網絡
수거질량%복잡수거%실체식별%XML도%복잡망락
复杂数据当前有着广泛的应用.有效地使用复杂数据需要对其质量进行管理.实体识别是数据质量管理的基本操作,用于在数据集合中发现同一实体的不同描述,其在数据质量管理中可以用于错误检测、不一致数据发现等.由于包含复杂的结构信息,复杂数据上的实体识别与传统文本和关系数据上的实体识别不同,带来了新的技术上的挑战.该文介绍了复杂数据上实体识别的概念和应用,分别讨论了XML数据、图数据和复杂网络上实体识别技术的原理,最后展望了未来的研究方向.
複雜數據噹前有著廣汎的應用.有效地使用複雜數據需要對其質量進行管理.實體識彆是數據質量管理的基本操作,用于在數據集閤中髮現同一實體的不同描述,其在數據質量管理中可以用于錯誤檢測、不一緻數據髮現等.由于包含複雜的結構信息,複雜數據上的實體識彆與傳統文本和關繫數據上的實體識彆不同,帶來瞭新的技術上的挑戰.該文介紹瞭複雜數據上實體識彆的概唸和應用,分彆討論瞭XML數據、圖數據和複雜網絡上實體識彆技術的原理,最後展望瞭未來的研究方嚮.
복잡수거당전유착엄범적응용.유효지사용복잡수거수요대기질량진행관리.실체식별시수거질량관리적기본조작,용우재수거집합중발현동일실체적불동묘술,기재수거질량관리중가이용우착오검측、불일치수거발현등.유우포함복잡적결구신식,복잡수거상적실체식별여전통문본화관계수거상적실체식별불동,대래료신적기술상적도전.해문개소료복잡수거상실체식별적개념화응용,분별토론료XML수거、도수거화복잡망락상실체식별기술적원리,최후전망료미래적연구방향.