所有提交的EM系统将被重定向到网上投稿系统.作者被要求将文章直接提交给网上投稿系统各自的日志。

不同压缩方法对图像压缩的比较分析

K.Mahendra先生1和P. Sathyanarayana博士2
  1. 印度Tirupati, a.p., sv U工程学院ECE系硕士生
  2. 印度Tirupati, a.p., sv U工程学院欧洲经委会系教授
有关文章载于Pubmed谷歌学者

更多相关文章请访问国际电气、电子和仪器工程高级研究杂志

摘要

本文主要研究自然图像和复合图像的各种图像压缩技术和算法。“复合图像”的定义是包含文本、自然(照片)图像和图形图像组合的图像。不同的数字图像压缩技术已经被回顾和提出,包括DCT, JPEG和H.264。离散余弦变换(DCT)是一种将信号转换为基本频率分量的技术。它被广泛应用于图像压缩。在这里,我们开发了一些简单的函数来计算DCT和压缩图像。JPEG是专门用于静态图像的流行压缩标准。每张图像划分为8 × 8像素;然后分别压缩每个块。当使用非常高的压缩时,8 × 8的块实际上可以在图像中看到。由于压缩机制的原因,解压缩后的图像与压缩后的图像并不相同。 A H.264 algorithm that suits both compound and natural images is beneficial in many applications including the Internet. Experimental results show that the H.264 algorithm is better PSNR values for natural and compound images to compare other techniques

关键字

H.264,复合图像,jpeg, dct,内部预测。

介绍

数字图像压缩是将图像数据速率降低以节省存储空间和降低传输速率要求的方法。然而,随着互联网的快速发展和富媒体应用的广泛应用,不仅产生了文字、自然和图形图像,还产生了将这三者结合在一起的图像。这些图像被称为“复合图像?”而例子包括计算机生成的图像、文本图像、扫描图像、文档图像等。复合图像示例如图(1)所示。
本文对自然图像和复合图像的三种不同的图像压缩算法进行了讨论和比较。第一个算法是离散余弦变换。离散余弦变换是一个快速变换。它是一种应用广泛且鲁棒的图像压缩方法。对于高度相关的数据,它具有出色的压缩效果。DCT具有固定基图像。DCT在信息打包能力和计算复杂度[1]之间有很好的折衷。第二种算法为JPEG (Joint Picture Expert Group)算法。JPEG使用一种基于离散余弦变换(DCT)的有损压缩形式。
压缩是通过一系列操作来完成的:变换、量化、之字形扫描、差分脉冲编码调制(DPCM)和熵编码。解压是通过按相反的顺序执行相反的步骤来完成的。我们假设数据仅以压缩格式可用。它是最好的压缩自然照片相比,其他技术[2]。最后一种算法是H.264。它对正常图像和复合图像非常有用。它有更好的PSNR值比较DCT和JPEG。它是一种基于块的技术,将复合图像/普通图像分割成16*16个宏块。这是为了在转换为H.264内部编码之前进行内部预测。H.264的新特点是使用4*4的变换块大小,而以前的图像编码标准使用8*8的DCT。 This smaller block size leads to a significant reduction in ringing artifacts [3]. In this compression is performed a series operations: intra prediction, transform, quantization, zigzag scanning and entropy encoding. Reconstruction is accomplished by performing inverse steps in an inverse order [4].

压缩技术

A)离散余弦变换:离散余弦变换(DCT)已广泛应用于图像压缩领域。它是由Ahmed, Natarajan和Rao[1974]开发的,DCT是离散傅里叶变换(DFT)的近亲。它在图像压缩中的应用是由Chen和Pratt[1984]首创的。采用离散余弦变换(DCT)减少像素间冗余。在压缩过程中,将输入图像分成8*8像素块,然后对每个像素块进行正二维离散余弦变换,得到变换后的图像。当需要时,通过解压缩重建图像。一种使用逆离散余弦变换(IDCT)的过程。图像是一个二维数组,因为这里我们使用的是二维DCT。二维离散余弦变换只是一个一维DCT应用了两次,一次在x方向,另一次在y方向。DCT方程计算图像DCT的(i,j)项。 The equation 2-D DCT is shown below.
方程(1)
方程(2)
P(x,y)是由矩阵表示的图像元素P, N是DCT执行的块的大小。方程计算一个元素((i,j)th)由原始图像矩阵的像素值来表示变换后的图像。对于DCT压缩使用的标准8 × 8块,等于8,x和y的范围从0到7。因此D(i,j)如式所示。
方程(3)
应用逆离散余弦变换(Inverse Discrete Cosine Transform, IDCT)可以从DCT系数重新计算图像中的原始样本。给出了块尺寸为8 × 8时IDCT的数学公式
方程(4)
DCT矩阵:为了得到式(1)的矩阵形式,我们将使用下面的方程,
方程(5)
当做逆DCT时,T的正交性很重要,因为T的逆是T',这很容易计算。在输入图像中,8*8块是从图像的左上角选择的,即M.在那里准备执行DCT,这是通过矩阵乘法来完成的。
方程(6)
上式中D为变换后的图像矩阵。D的一部分被选在D?它在两个维度上的系数都是0到3。D ?为D以1:4压缩的压缩格式。
方程(7)
在维11为接收机处重新制定的图像矩阵,如eqn(7)所示。其中D' ' O表示4*4个零。然后利用离散余弦反变换进行重构。重建图像(R)如式8所示。
方程(8)
B) JPEG压缩算法:JPEG使用基于离散余弦变换(DCT)的有损压缩形式。JPEG有几种变体,但这里只讨论“基线”方法。
如图1.1所示,首先将图像划分为不重叠的8 × 8块。对每个块进行前向离散余弦变换(FDCT),将像素的空间域灰度转换为频域系数。DCT系数计算完成后,根据心理视觉证据进行的JPEG标准提供的量化表进行不同尺度的归一化。量化后的系数以之字形扫描顺序重新排列,并采用有效的无损编码算法(如跑长编码、算术编码、霍夫曼编码)进一步压缩。解码过程就是图1.2所示的编码逆过程。
上图是JPEG解码器的框图。通过以相反的顺序应用前面每个步骤的倒数来完成解压。因此,解码过程从熵解码开始,然后将运行长度转换为0和系数序列。系数去量化,逆离散余弦变换(IDCT)执行检索解压缩图像。
C)拟议算法:-拟议算法命名为h.264算法。它对于自然图像和复合图像非常有用。与两种算法相比,该算法具有更好的PSNR值和更好的压缩效率。h.264编解码器框图如图1.3所示。
上图中有两个主要的数据流路径,从左到右(编码)和从右到左(重构)。编码流程如下:
1)采用基于块的分割方法将原始图像分割为16*16个宏块,然后进行内预测。
2) H.264标准中的intra预测有效地降低了16 × 16和4 × 4块之间的空间相关性,当前块由上面和左边块中的相邻像素预测并生成P。
3)从原始宏块中减去P,得到残差宏块D。
4)利用DCT对D进行变换。通常将D分成8 × 8或4 × 4个子块,每个子块分别进行转换。
5)对每个子块进行量化(X)。
6)将每个子块的DCT系数重新排序并进行运行级编码。最后,对每个宏块的系数、向量和相关报头信息进行熵编码(霍夫曼编码)以产生压缩的比特流。
重构数据流程如下:
1)对压缩比特流进行熵解码(Huffman解码),以提取每个宏块的系数、运动向量和报头
2)运行长度编码和重排序是反向的,以产生一个量化的、转换的宏块X。
3)对X进行缩放和逆变换,得到解码后的残差D。
4)在D_中加入P,得到重构宏块。保存重构的宏块。
5)对重构后的宏块进行去块滤波,得到恢复图像。
进行实验的输入图像(正常图像类型)如图1.4所示,重建图像如图1.5所示。该表2.1给出了该图像和其他图像的均方误差和峰值信噪比值。

压缩算法的特点

图像质量描述图像压缩方案用于重新创建源图像数据的保真度。判断图像压缩算法有四个主要特征。
i)压缩比:压缩比等于原始图像的大小除以压缩图像的大小。这个比率给出了特定图像的压缩程度。所达到的压缩比通常表示图像质量。一般来说,压缩比越高,得到的图像质量越差。压缩比和图像质量之间的权衡是压缩图像时需要考虑的重要问题。一些压缩方案产生的压缩比高度依赖于图像内容。压缩的这一方面被称为数据依赖。
ii)压缩时间:压缩时间和解压缩时间分别定义为压缩和解压缩图像所需的时间。它们的价值取决于以下考虑因素:
•压缩算法的复杂性。
•算法的软件或硬件实现的效率。
•所使用处理器或辅助硬件的速度。
iii)均方误差:均方误差测量原始图像与压缩图像之间的平方误差。均方误差的公式为
方程
其中M X N为图像的大小,f'(i,j)和f(i,j)为解压缩后的图像与原始图像在(i,j)像素处的矩阵元素。
iv)峰值信噪比:输入原始图像与重建图像之间计算出的峰值信噪比称为PSNR。PSNR是度量有耗压缩编解码器重构质量最常用的方法。S(例如,图像压缩)。PSNR通常用对数分贝标度来表示,PSNR的计算公式为
方程
这里,MAXi是图像可能的最大像素值。当像素用8位表示每个样本时,这是281 = 255。更一般地,当样本使用线性PCM表示,每个样本有B位,则MAXi=2B1。

比较结果

使用DCT、JPEG和H.264算法的不同有损压缩方法针对不同类型的图像(普通图像、复合图像、文字图像、幻灯片图像)。表1.1比较了均方误差和峰值信噪比值。与其他两种方法相比,H.264算法的均方误差和峰值信噪比值更好。

结论

本文采用四种不同类型的图像,如普通图像、复合图像、文字图像、幻灯片图像进行压缩和解压。所有这些图像都通过使用三种不同的方法进行压缩和解压缩。与其他两种方法相比,H.264方法对所有类型的图像都提供了更好的均方误差和峰值信噪比值。因此H.264方法在均方误差和峰值信噪比方面优于DCT和JPEG。

表格一览

表的图标
表1

数字一览

图1 图2 图3
图1 图1一个 图1 b
图1 图2 图3
图1 c 图1 d 图1 e

参考文献










全球科技峰会