计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2007年
z3期
379-385
,共7页
XML压缩%增量式压缩%XML文档树分割
XML壓縮%增量式壓縮%XML文檔樹分割
XML압축%증량식압축%XML문당수분할
XML已成为网络传输、信息交换领域数据交换和存储的标准.由于XML文档的自描述性,导致信息冗余,特别是在一些特殊的应用场合,如PDA,Smart Phone等网络资源受限的系统中,网络性能受到较大影响.虽然目前很多研究者提出了通过对XML文档进行压缩,来缓解系统负担,但是大部分的压缩方法关注单个文档的压缩,而对文档集合压缩效果较差.分析了已有的XML压缩算法在实际使用中的潜在问题,提出了一种新的基于文件差异的XML文档压缩算法--XDrill. 该算法通过对XML文档树进行划分来挖掘文档内部以及文档间的冗余信息,得到了良好的压缩效果.通过对XDrill系统的理论分析以及对实际数据集的测试表明,XDrill在压缩单个文档的性能上与XMill接近,对文档集合的压缩效果明显优于XMill压缩方法.同时,相比已有的XML压缩算法,XDrill支持增量式存储,并可以降低更新操作的系统开销.
XML已成為網絡傳輸、信息交換領域數據交換和存儲的標準.由于XML文檔的自描述性,導緻信息冗餘,特彆是在一些特殊的應用場閤,如PDA,Smart Phone等網絡資源受限的繫統中,網絡性能受到較大影響.雖然目前很多研究者提齣瞭通過對XML文檔進行壓縮,來緩解繫統負擔,但是大部分的壓縮方法關註單箇文檔的壓縮,而對文檔集閤壓縮效果較差.分析瞭已有的XML壓縮算法在實際使用中的潛在問題,提齣瞭一種新的基于文件差異的XML文檔壓縮算法--XDrill. 該算法通過對XML文檔樹進行劃分來挖掘文檔內部以及文檔間的冗餘信息,得到瞭良好的壓縮效果.通過對XDrill繫統的理論分析以及對實際數據集的測試錶明,XDrill在壓縮單箇文檔的性能上與XMill接近,對文檔集閤的壓縮效果明顯優于XMill壓縮方法.同時,相比已有的XML壓縮算法,XDrill支持增量式存儲,併可以降低更新操作的繫統開銷.
XML이성위망락전수、신식교환영역수거교환화존저적표준.유우XML문당적자묘술성,도치신식용여,특별시재일사특수적응용장합,여PDA,Smart Phone등망락자원수한적계통중,망락성능수도교대영향.수연목전흔다연구자제출료통과대XML문당진행압축,래완해계통부담,단시대부분적압축방법관주단개문당적압축,이대문당집합압축효과교차.분석료이유적XML압축산법재실제사용중적잠재문제,제출료일충신적기우문건차이적XML문당압축산법--XDrill. 해산법통과대XML문당수진행화분래알굴문당내부이급문당간적용여신식,득도료량호적압축효과.통과대XDrill계통적이론분석이급대실제수거집적측시표명,XDrill재압축단개문당적성능상여XMill접근,대문당집합적압축효과명현우우XMill압축방법.동시,상비이유적XML압축산법,XDrill지지증량식존저,병가이강저경신조작적계통개소.