LZW压缩算法是Unisys的专利,由Lempel-Ziv-Welch三人发明,有效期到2003年。
LZW思路:
ASCII字符有255个,每个用8bits表示,如果要表示2个字符,就用16bits;3个字符就用24bits,依此类推。假设我们对ASCII码扩展成12位,可以有4096个字符,并自己定义255以后的含义,如ab定义成258,abc定义成259,那么ab只用9位,较原来节约7位;abc也只用9位,较原来24bits节约15位,可以想象,代替的字符串越长,位数越节约。一般LZW压缩比为2:1或3:1。这是以前系统内存以及存储能力较小,为提高计算和存储能力而设计的。到现在,计算机性能突飞猛进,其优势就不复存在。
LZW核心是在于其压缩算法——动态生成压缩字典,自动还原压缩字典进行解压,压缩数据内含压缩字典,边压缩边生成压缩字典,但不保存;解压时,边解压边还原压缩字典,进行解压。
压缩
生成压缩字典就是如何将255个的ASCII码动态扩展成最大4096个字符码的过程。
(1)形成关键字为255个ascii码,值为0~255的初始字典,设定clearcode=256,endcode=257。(clearcode是为了在解压时避免扩展字典容量超过4096时,告诉程序以后的压缩数据的压缩字典重新计算;endcode表示结束)
(2)读取一个字符(input),和根字符(root)形成新的字符串(key),如果新字符串(key)在字典里存在,将根字符用新字符串(key)取代;如果key不存在,则将root计入输出流,input计为root字符,在字典中添加Key。
以ababababa为例,演示其压缩过程:
| index | Input | Root |

:LZW压缩&spm=1001.2101.3001.5002&articleId=103575209&d=1&t=3&u=77bd8af867e54eabaa035d905cb77e0a)
1万+

被折叠的 条评论
为什么被折叠?



