华侨大学学报(自然科学版)
華僑大學學報(自然科學版)
화교대학학보(자연과학판)
JOURNAL OF HUAQIAO UNIVERSITY(NATURAL SCIENCE)
2014年
4期
387-391
,共5页
类识别%可扩展标记语言%数据绑定%模式树图%节点类型%相似度
類識彆%可擴展標記語言%數據綁定%模式樹圖%節點類型%相似度
류식별%가확전표기어언%수거방정%모식수도%절점류형%상사도
class recognition%extensible markup language%data binding%pattern tree diagram%node type%similarity
为解决当前可扩展标记语言(XML)绑定框架普遍存在的由 XML模式映射生成的数据类的冗余,以及数据类系统规模过大的问题,提出一种从一组相关 XML数据文件的数据实体类识别方法。该方法先抽取这一组 XML数据文件的 XML模式树图,并将其每个节点表示成向量空间中的向量;然后,利用相似度和距离识别该模式节点对应的预定义模式节点类型;最后,按模式节点类型到类的映射规则得到数据类。结果表明:该方法能识别合并对应同一个实体的数据类避免类冗余,将集合类型的 XML文件映射成泛型类和集合类减小生成类系统的规模。
為解決噹前可擴展標記語言(XML)綁定框架普遍存在的由 XML模式映射生成的數據類的冗餘,以及數據類繫統規模過大的問題,提齣一種從一組相關 XML數據文件的數據實體類識彆方法。該方法先抽取這一組 XML數據文件的 XML模式樹圖,併將其每箇節點錶示成嚮量空間中的嚮量;然後,利用相似度和距離識彆該模式節點對應的預定義模式節點類型;最後,按模式節點類型到類的映射規則得到數據類。結果錶明:該方法能識彆閤併對應同一箇實體的數據類避免類冗餘,將集閤類型的 XML文件映射成汎型類和集閤類減小生成類繫統的規模。
위해결당전가확전표기어언(XML)방정광가보편존재적유 XML모식영사생성적수거류적용여,이급수거류계통규모과대적문제,제출일충종일조상관 XML수거문건적수거실체류식별방법。해방법선추취저일조 XML수거문건적 XML모식수도,병장기매개절점표시성향량공간중적향량;연후,이용상사도화거리식별해모식절점대응적예정의모식절점류형;최후,안모식절점류형도류적영사규칙득도수거류。결과표명:해방법능식별합병대응동일개실체적수거류피면류용여,장집합류형적 XML문건영사성범형류화집합류감소생성류계통적규모。
In order to solve the XML binding framework ubiquitous redundant classes generated by the XML schema mapping and data class system large scale,we presented a method of data entity class recognition from a group of related XML data file.The method first extracted XML mode tree a group of XML data files,and each node was represented as a vector in the vector space.Then used their similarity and distance to identify the mode node corresponded to a predefined mode node types.Finally by according to the mode node type to the class mapping rules to obtain the data classes.The results showed that:this method can identify and merger the class that correspond to the same entity to avoid redundant, mapped the collection of XML documents into a generic class and collection class to reduce the size of the generate class system.