计算机应用与软件
計算機應用與軟件
계산궤응용여연건
COMPUTER APPLICATIONS AND SOFTWARE
2009年
4期
51-54
,共4页
半结构化数据%模式抽取%OEM模型%标签路径%标签路径的支持度%标签路径的目标集
半結構化數據%模式抽取%OEM模型%標籤路徑%標籤路徑的支持度%標籤路徑的目標集
반결구화수거%모식추취%OEM모형%표첨로경%표첨로경적지지도%표첨로경적목표집
半结构化数据的模式抽取对于半结构化数据查询、优化及异构数据的集成具有重要的意义.结合标签路径及标签路径的目标集概念,提出了基于OEM(Object Exchange Model)模型的半结构化数据最小化模式抽取新方法,并给出了与标签路径目标集、支持度计算相关的两个定理.算法的基本思路:依据文中的两个定理,采用宽度优先自顶向下的遍历策略依次求出各标签路径的最后一个标签的目标集及支持度,标签支持度大的目标集优先映射为对应的模式节点.对同一半结构数据实例,算法抽取的模式与其他算法得到的模式相比规模小、算法执行时间短.算法适用于层次型及包含环路的OEM半结构化数据模式抽取.
半結構化數據的模式抽取對于半結構化數據查詢、優化及異構數據的集成具有重要的意義.結閤標籤路徑及標籤路徑的目標集概唸,提齣瞭基于OEM(Object Exchange Model)模型的半結構化數據最小化模式抽取新方法,併給齣瞭與標籤路徑目標集、支持度計算相關的兩箇定理.算法的基本思路:依據文中的兩箇定理,採用寬度優先自頂嚮下的遍歷策略依次求齣各標籤路徑的最後一箇標籤的目標集及支持度,標籤支持度大的目標集優先映射為對應的模式節點.對同一半結構數據實例,算法抽取的模式與其他算法得到的模式相比規模小、算法執行時間短.算法適用于層次型及包含環路的OEM半結構化數據模式抽取.
반결구화수거적모식추취대우반결구화수거사순、우화급이구수거적집성구유중요적의의.결합표첨로경급표첨로경적목표집개념,제출료기우OEM(Object Exchange Model)모형적반결구화수거최소화모식추취신방법,병급출료여표첨로경목표집、지지도계산상관적량개정리.산법적기본사로:의거문중적량개정리,채용관도우선자정향하적편력책략의차구출각표첨로경적최후일개표첨적목표집급지지도,표첨지지도대적목표집우선영사위대응적모식절점.대동일반결구수거실례,산법추취적모식여기타산법득도적모식상비규모소、산법집행시간단.산법괄용우층차형급포함배로적OEM반결구화수거모식추취.