Untitled Document

　　JPEG(Joint Photographic Experts Group)是联合图像专家小组的英文缩写。其中联合的含意是指，国际电报电话咨询委员会(CCITI)和国际标准化协会(ISO)联合组成的一个图像专家小组。
　　联合图像专家小组，多年来一直致力于标准化工作，他们开发研制出，连续色调、多级灰度、静止图像的数字图像压缩编码方法。这个压缩编码方法称为JPEG算法。JPEG算法被确定为JPEG国际标准，它是国际上，彩色、灰度、静止图像的第一个国际标准。JPEG标准是一个适用范围广泛的通用标准。它不仅适于静图像的压缩；电视图像序列的帧内图像的压缩编码，也常采用JPEG压缩标准。
　　在JPEG编码中用到了我们已学过的变换编码、预测编码和熵编码等原理和方法。这一章前面几节讲的内容是这一部分的基础。因此我们把重点放在JPEG的编码算法的具体实现上。

　　在对"基于空间预测编码DPCM的无失真压缩算法"的简单介绍后，我们将重点讲述基于DCT变换有失真的压缩算法。

　　这幅图是无失真的预测编码的原理图，由无失真编码器实现数据压缩，它由预测器和熵编码器组成。预测器采用的是基于DPCM预测编码方法，例如对"

"点的预测值"

"由"a、b、c"算出，进行三阶预测；该预测器提供了7个选项，如表4.6-1 所示，选"1、2、3"是一维预测；选"4、5、6、7"是二维预测。
熵编码器是对

的差进行无失真的熵编码，比如算术编码或哈夫曼编码。

　　下面我们重点讲述基于DCT 的有失真压缩编码，希望大家认真学习，把这部分内容掌握了。
　　学习JPEG编码的方法我们仍然采用从"总体把握"再到"细节理解"从而达到彻底掌握的学习思路。

　　首先来看"基于DCT的编码器处理步骤"图。从这幅图我们可以看出JPEG编码的处理过程，从总的来说是这样的：对于一幅图像首先将其分成许多个"8×8"的小块，也就是每个小块有8×8=64个像素；分成多少个小块要看图像的分辨率，分辨率高，分的块就多，分辨率小，分的块就少。然后对（每一个）8×8的块进行DCT变换（二维），经过DCT变换后就得到频域的64个离散余弦变换系数，得到64个离散余弦变换系数后，要对这64个系数进行量化，量化是根据"表说明"也就是量化表进行的，量化表是JPEG组织根据人的眼睛视觉特性规定好的，直接用量化表去除得到的64个系数就是量化，量化后得到的仍是一个（8×8）64的系数，而这一系数已是低频集中在左上角的一个8×8的系数了。最后再利用熵编码表对其进行熵编码，熵编码后的到的就是已压缩的图像数据。这是一个总的过程，我把刚才说的归纳如下：

　　在对总体有了一个认识后，再细说各部分是如何具体实现的。

　　对于第一步，将图像分成8×8的块，我们想解释的是：按什么次序分？是按从左到右，从上到下的次序来分，并按该顺序送入DCT编码器，一个接一个的变换。第二个要说的是：被压缩的图像可以是黑白图像，也可以是彩色图像，对于黑白图像每小块只有64个灰度值作为下一步的输入；对于彩色图像不仅要有64个亮度值，而且还有色差值，这两种值要分别做DCT变换。

　　每个8×8二维每个8×8二维源图像采样数据块，实际上是64点离散信号，该信号是空间二维参数x和y的函数。FDCT把这些信号作为输入，然后把它分解成64个正交基信号，每个正交基信号对应于64个独立二维(2D)空间频率中的一个，这些空间频率是由输入信号的频谱组成。FDCT的输出是64个基信号的幅值，或称DCT系数，每个系数值由64点输入信号唯一地确定。即离散余弦变换的变换系数。

　　比如：下图是均匀量化的特性图，表示当输入值在"0--0.5"时量化输出的的结果为"0"；当输入值在"0.5--1.5"时（4舍5入）量化输出的的结果为"1"。这样实现多到一的映射。

　　量化器步长

是量化的关键，JPEG标准给出了一个参考标准--量化表，量化表就是给出了量化步长。量化器步长应如何定义呢？人的眼睛对亮度比较敏感，对色差不敏感，对亮度和色差采用不同的量化步长。因而有了亮度量化表和色度量化表，这两张表如下：

　　从这两张表可以看出，对亮度的量化步长划分的"细"一些，对色度的量化步长划分的"粗"一些；两张表都是在低频部分（左上角）步长小一些，在高频部分（右下角）步长大许多。
　　因为DCT变换后能量大部分集中在左上角，所以对其细一些。这样一量化，量化就是用DCT系数除以量化表。那么量化后高频部分会出现一些"0"，就实现了压缩，而且失真也就是在此发生的。再强调一下，JPEG标准的具体做法是用64个DCT系数除以（一一对应）量化表中的64个数。

　　下一步对量化后的结果进行熵编码

　　在做熵编码之前，先明确两个概念：DC系数和AC系数。
　　量化后得到的仍是64个系数，量化并没有改变系数的性质。大家知到DCT变换是将数据域从时（空）域变换到频域，在频域平面上变换系数是二维频域变量u和v的函数。对应于u=0，v=0的系数，称做直流分量，即DC系数，其余63个系数称做AC系数，即交流分量。如图4.6-5，红点位置上的系数就是直流系数，其它63个绿点位置上的系数就是交流分量。

　　DC系数是64个图像采样平均值。因为在一幅图像中像素之间的灰度或色差信号变化缓慢，相邻的8×8块之间有更强的相关性，所以相邻块的DC系数值很接近，对量化后前后两块之间的DC系数差值，进行编码，可以用较少的比特数。DC系数包含了整个图像能量的主要部分，远离直流系数的高频交流系数大多数为零或趋于零。例如，图4.6-6是某一特定8×8图像块的量化后的DCT系数。可见DC系数值最大，离直流系数远的大部分都为零。

　　4.6-6所示的数据大部分都是"0"，用那一种编码来表示它呢？既能表示出系数的相对位置有能说明系数的值，而且编码效率又比较高？

　　编码时从左上方

开始，沿箭头方向，以"Z"字形行程扫描，直到

扫描结束。

　　沿"Z"字形路径行进，可使值为"0"AC系数集中，在这种情况下使用行程编码方法更有效。
　　63个AC系数行程编码的码字，可用两个字节表示，如图4.6-8所示。

　　为了进一步达到压缩数据的目的，需对量化后的DC系数，和行程编码后的AC系数进行基于统计特性的熵编码。JPEG建议使用两种熵编码方法：哈夫曼(Huffman)编码和自适应二进制算术编码(Adaptive Binary Arithmetic Coding)。

　　这个中间格式符号就是上面所说的AC系数行程编码的码字。可以这样理解：

　　在这需说明的是：关于符号1：当两个非零AC系数之间连续零的个数超过15时，用增加扩展符号1"（15，0）"的个数来扩充。对于8×8块的63个AC系数最多增加三个"(15，0)"扩展符号1。块结束(EOB)以(0， 0)表示。
　　关于符号2直接用二进制数编码表示，若幅值为负数用反码表示。

　　可变长度熵编码就是对符号1、2对序列的统计编码。

　　设"NNNN"的值为"n"，SSSS的值为"s"则符号1可以写成符号1（n,s）
　　例如符号1（3，4）表示非零两个符号之间有3个"0"，下一个非零符号用4比特，
　　对符号1的编码就是在"AC系数表中，查3/4所对应的编码。