小型微型计算机系统
小型微型計算機繫統
소형미형계산궤계통
MINI-MICRO SYSTEMS
2013年
8期
1843-1847
,共5页
实体解析%记录聚合%MapReduce编程模型%患者标识交叉索引
實體解析%記錄聚閤%MapReduce編程模型%患者標識交扠索引
실체해석%기록취합%MapReduce편정모형%환자표식교차색인
entity resolution%record aggregation%MapReduce programming model%patient identifier cross-referencing
实体解析用于判断两个数据记录是否描述的是同一实体对象,记录聚合则把所有属于同一实体对象的数据记录进行聚集,建立关联,方便交叉索引.本文基于MapReduce编程模型,提出一种迭代的并行处理框架,采用面向学习的分类方法进行实体解析,根据属性相似的传递性,并结合函数式语言的本身特性,对记录进行高效聚合.相关算法和框架应用于建立医院之间患者标识交叉索引平台,为患者主索引的建立以及信息共享提供依据.实验结果表明,MapReduce编程模型非常适合于实体解析与记录聚合的一体化处理,其编程快捷,运行高效,而且数据分区和并行处理技术避免了大量连接引发的内存溢出问题.
實體解析用于判斷兩箇數據記錄是否描述的是同一實體對象,記錄聚閤則把所有屬于同一實體對象的數據記錄進行聚集,建立關聯,方便交扠索引.本文基于MapReduce編程模型,提齣一種迭代的併行處理框架,採用麵嚮學習的分類方法進行實體解析,根據屬性相似的傳遞性,併結閤函數式語言的本身特性,對記錄進行高效聚閤.相關算法和框架應用于建立醫院之間患者標識交扠索引平檯,為患者主索引的建立以及信息共享提供依據.實驗結果錶明,MapReduce編程模型非常適閤于實體解析與記錄聚閤的一體化處理,其編程快捷,運行高效,而且數據分區和併行處理技術避免瞭大量連接引髮的內存溢齣問題.
실체해석용우판단량개수거기록시부묘술적시동일실체대상,기록취합칙파소유속우동일실체대상적수거기록진행취집,건립관련,방편교차색인.본문기우MapReduce편정모형,제출일충질대적병행처리광가,채용면향학습적분류방법진행실체해석,근거속성상사적전체성,병결합함수식어언적본신특성,대기록진행고효취합.상관산법화광가응용우건립의원지간환자표식교차색인평태,위환자주색인적건립이급신식공향제공의거.실험결과표명,MapReduce편정모형비상괄합우실체해석여기록취합적일체화처리,기편정쾌첩,운행고효,이차수거분구화병행처리기술피면료대량련접인발적내존일출문제.