所有提交的EM系统将被重定向到网上投稿系统.作者被要求将文章直接提交给网上投稿系统各自的日志。

一种新的avs内编码定向空间预测扫描方案

Salah Uddin Yusuf博士1, Mohiuddin Ahmad2
  1. 孟加拉国库尔纳工程技术大学EEE系助理教授
  2. 孟加拉国库尔纳工程技术大学EEE系教授
有关文章载于Pubmed,谷歌学者

更多相关文章请访问国际电气、电子和仪器工程高级研究杂志

摘要

变换系数扫描是视频编码的一个重要步骤。在MPEG2、MPEG4、H.264/AVC、AVS等视频编码标准中,帧编码采用之字形扫描,场编码采用场扫描。本文提出了一种新的AVS内预测编码扫描方案(Z-Scan)。传统之字形扫描采用固定扫描模式,其设计目的是组织量化的变换系数,尽可能多地引入高频分量,从而利用熵编码更有效地对系数进行编码。但是,由于不同的内部预测产生不同的剩余能量分布,锯齿扫描不能有效地组织变换系数。为了解决这一问题,本文提出了一种新的zscan方案,进一步提高了AVS标准的内编码效率。该方法根据空间预测方向,分别采用传统的之字形扫描、水平z扫描和垂直z扫描。在不改变语法的情况下,实现我们的z扫描方案到AVS编解码器中是相对容易的。实验结果表明,z扫描方案在保持视频序列PSNR的前提下,比使用锯齿扫描的AVS编解码器可显著降低约2.1%的比特率。仿真结果表明,所提出的自适应系数扫描方案能够显著提高压缩效果。

关键字

z扫描,锯齿扫描,内部编码,AVS,编码效率,H.264/AVC。

介绍

AVS (Audio Video Coding Standard)是中国媒体压缩的国家标准,由中国音视频编码标准工作组制定。与H.264/AVC视频编码标准类似,AVS是一种基于块变换的编解码器,采用运行长度编码技术对特定预测残差块对应的量化系数进行编码。运行长度编码通过用预先定义的模式锯齿状扫描量化变换系数块进行。在AVS内部编码中,支持5种不同的8x8块内部预测方法[1]。一般来说,不同的内部预测方法可以引入不同的预测残差。因此,仅使用之字形扫描对不同方向预测的残差信号进行编码效率较低。
近年来,为了解决这一问题,许多人致力于开发一种适合各种视频编码标准的san模式。对于MPEG-4内区编码,[2]根据DC预测方向对每个内区进行三次块级自适应扫描(垂直交替、水平交替和之字形)。对于H.264/AVC内编码,[3]、[4]、[6]提出分别对垂直预测块和水平预测块使用两种额外的扫描模式,其他预测模式采用传统的之字形扫描。类似地,在[5]中,他们提出了一种自适应扫描方法,对每种intra预测模式使用不同的扫描方法。对于AVS标准,在[7]中根据预测残差的统计分布,提出了一种自适应地为每个宏块选择最佳扫描模式来排列量化的DCT系数的MLASS方案,该方案既可用于内编码,也可用于间编码。
本文在上述研究工作的启发下,提出了一种用于AVS内编码的z扫描方案,可以进一步提高编码效率,节省码率。在该方案中,根据空间预测方向,使用水平z扫描和垂直z扫描两个额外的扫描表与普通之字形扫描一起组织系数。在接下来的章节中,AVS内部编码过程的简要概述将在第二节给出。第三节给出了详细的z扫描方案设计。第四节给出了我们提出的方法的实验结果。最后,第五节讨论了结论和未来的工作。

avs内部编码概述

AVS内编码与H.264/AVC相似,不同之处在于在空间域中对每个8x8的亮度/色差块进行预测。通过空间预测和变换编码去除剩余空间冗余。AVS内编码器的总体框图如图1所示。
A.内部预测和转换
对于图1中的intra预测部分,从先前编码和重建的相邻块中对P-和b帧的intra块和intra-coded macroblock进行空间预测。对于luma样本,每个8×8块有五个方向内模式:
垂直(模式0),水平(模式1),DC(模式2),左下(模式3)和彻头彻尾(模式4)。
图2展示了8x8内预测的过程。为了对亮度块进行编码,将使用当前块上方和右侧先前解码过的16个像素,以及当前块左侧和下方先前解码过的16个像素来预测当前块像素。在模式选择部分,选择每个块在RD性能方面的最佳预测模式。在内部预测之后,AVS对剩余块执行可分离的8x8整数余弦变换(ICT)进行能量压缩,然后进行量化以最小化编码复杂性。
B.锯齿扫描和挑战
对量化后的变换系数进行二进制编码,将这些系数按照图3所示的之字形顺序映射成一维数组。因此,较大的低频系数被放在通常为零的高频系数前面。
我们知道,锯齿扫描可以有效地对图像编码系统(如JPEG2000)中变换典型图像块的系数进行分组。然而,在基于定向空间预测的视频编码系统中,它可能不是组织变换系数的理想方法。我们已经观察到变换残差块中可能系数的模式显示了某种局部数据依赖性。视频序列中不同的纹理区域决定了不同的最优预测模式,同时,不同的内部预测模式导致了不同的残差系数分布。因此,对于每个具有各种纹理特征的块,一个固定的扫描模式并不总是理想的(在减少表示当前块所需的比特的意义上)。
例如,使用垂直或水平预测模式作为最佳模式的块与使用其他预测模式的块[3]显示不同的频率变化特征。在此,我们重点介绍了纵向预测和横向预测。当一个块被赋予垂直方向的预测模式时,垂直方向的预测残差像素在垂直方向上具有较高的相关性;因此,在正面向上的排中,变换系数会有比较大的值,不太可能被量化为零。以类似的方式,当一个块使用水平内预测时,左正面列中的变换系数由于其相对较大的值而不太可能被量化为零。
然而,AVS中使用的锯齿扫描没有考虑上面所述的具体变换系数分布特征。从图3可以看出,锯齿扫描特别适合于对称系数分布,因为它沿水平方向和垂直方向扫描,优先级相同。因此,在使用垂直预测或水平预测时,锯齿扫描不能有效地组织系数。同时,由于非零系数分组较少,导致熵编码效率降低。
为了进一步提高编码效率,我们的目标是设计一种更好的扫描方法,能够利用不同内预测模式的特定分布特征。

z -扫描方案方法学

基于以上分析,我们提出了一种新的z扫描方案。如图3所示,在本文方案中增加了两种扫描方式:水平z扫描(图4)和垂直z扫描(图5)。
类似地,垂直z扫描将用于通过水平模式预测块内。同样从左上位置开始;它从左到右逐列地将每个位置扫描为z形单元。所有垂直方向的系数都比水平方向的系数读取速度快;非零系数可以在垂直方向上更有效地分组。当当前块使用DC、Down-left和totally三种预测模式时,将使用传统的之字形扫描来组织变换系数。
根据上面的描述,AVS标准的扫描功能加入到两个新的扫描模式中,因此在新的AVS编解码器中我们有包括锯齿扫描在内的三个扫描表。新的扫描流程可以执行如下操作:
(i)对于每个单独的块,在扫描前,将由内预测函数告知当前块的预测模式。
(ii)对于每个单独的块,在扫描前,将由intra预测函数告知当前块的预测模式。
(iii)以Intra预测模式作为决定扫描模式的信号。使用垂直预测的块将选择水平z扫描,使用水平预测的块将选择垂直z扫描,使用其他三种预测模式的块将选择之字形扫描。
(iv)用相应的扫描模式扫描变换系数块。
需要注意的是,在AVS编解码器中,没有多余的比特来表示当前块的内预测模式信号,因为它可以直接从扫描函数之前的内预测函数推导出来。

实验结果

本节介绍实验结果。采用中国AVS集团开发的测试模型avs_sm0.4(吉准剖面)对所提出的z-扫描方案进行性能评估。所有试验条件均见表i。4个不同qp序列的试验结果见表II。
第二列显示了我们实验中使用的不同QP,可以看出,对于每个QP,我们的方法都优于传统的AVS,因此我们的方案与量化参数无关。最后一列表明,在每种条件下,所提出的z扫描方案与仅使用之字形扫描的传统AVS标准相比,平均可节省约2.07%比特。此外,它可以实现最大比特率节省3.4%。更重要的是,如第3列和第5列所示,我们的z扫描方案可以获得相似的PSNR值,同时显著降低比特率。
对于每个序列,考虑到使用的量化参数越粗,将有越多的系数量化为零。因此,我们的z扫描方法更容易有效地将更多的零系数组合在较少连续的非零值之后。这样,QP越高,就能获得更大的性能提升。
对于City (4CIF)序列,视频纹理非常复杂,使用简单的垂直或水平模式进行预测的效果较小。因此,对于City (4CIF)序列并没有太大的改进。对于Foreman (CIF)序列,由于其区域更平坦,图像纹理不那么复杂,编码效率提高的空间甚至很小。Paris (CIF)和Soccer (4CIF)序列的共同特点是背景相对简单和固定。这一特征导致用垂直和水平模式预测更多的块。因此,在我们提出的方法中,可以节省更多的比特率。众所周知,由于难以实现内部编码的改进,我们的实验中比特率的节省显然是显著的,特别是几乎没有降低质量。

结论及未来工作

本文提出了一种用于AVS内编码方向空间预测的z扫描新方法。每个块根据其内部预测模式从三个扫描表中选择合适的扫描模式。实验结果表明,在所有测试序列中,无论测试条件如何,实现了新的扫描模式后,在RD性能方面的内编码效率都优于传统的固定之字形扫描模式。此外,在我们的z扫描实现中没有额外的计算成本。本文将从编码器和解码器两个方面研究一种不发送当前块预测模式的快速z扫描方法。

表格一览

表的图标 表的图标
表1 表2

数字一览

图1 图2 图3 图4 图5
图1 图2 图3 图4 图5

参考文献








全球科技峰会