计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2014年
3期
112-116
,共5页
中文文本%数据压缩%压缩算法%编码%LZW
中文文本%數據壓縮%壓縮算法%編碼%LZW
중문문본%수거압축%압축산법%편마%LZW
Chinese text%data compression%compression algorithm%encoding%LZW
结合中文文本中的汉字编码方式、大字符集以及重复字串不长三个不同于英文文本的结构特点对LZW算法从读取数据方式、基本码集和字典码值输出方式三方面进行了修改。改进后的算法对中文文本的压缩比平均比LZW19提高了19%且压缩和解压速度与后者相当,其对较长的中文文本的平均压缩比已接近或者超过了压缩软件WinRAR。
結閤中文文本中的漢字編碼方式、大字符集以及重複字串不長三箇不同于英文文本的結構特點對LZW算法從讀取數據方式、基本碼集和字典碼值輸齣方式三方麵進行瞭脩改。改進後的算法對中文文本的壓縮比平均比LZW19提高瞭19%且壓縮和解壓速度與後者相噹,其對較長的中文文本的平均壓縮比已接近或者超過瞭壓縮軟件WinRAR。
결합중문문본중적한자편마방식、대자부집이급중복자천불장삼개불동우영문문본적결구특점대LZW산법종독취수거방식、기본마집화자전마치수출방식삼방면진행료수개。개진후적산법대중문문본적압축비평균비LZW19제고료19%차압축화해압속도여후자상당,기대교장적중문문본적평균압축비이접근혹자초과료압축연건WinRAR。
This paper presents a compression algorithm for Chinese text which is improved from LZW algorithm. By modify-ing LZW algorithm’s dictionary size, basic set and the output way of dictionary code, the improved algorithm LZW_CH demonstrates about 19%higher compression ratio than LZW19’s with almost the same execution speed. LZW_CH doesn’t need any pre-processing work for the compressing data. As a single compression algorithm, LZW_CH’s compression with long Chinese text has closed or exceeded the professional compression utility WinRAR.