关键字 |
聚积科技,模式决定,提前终止计划,视频编码,AVC / h。 |
介绍 |
最新的视频编码标准被称为h / AVC[1],[2],大大优于之前的MPEG - 1/2/4和H.261/263[3] -[6]标准方面的图像质量和压缩效率。为了实现编码效率最高,h .雇佣率失真优化(RDO)技术来得到最优的编码结果的编码质量和最小化最大化产生的数据位(7、8)。因此,它必须编码所有可能的模式,包括内部和帧间预测模式,允许适应可变块运动估计,很多有助于预测精度。的基本思想引入许多预测模式,与更高的运动细节可以更好的编码块小块;同样,块用更少的运动细节可以与更大的块编码模式[2]。 |
虽然可变块大小技术可以显著提高预测精度,它也带来巨大的计算加载,因为每个宏模块有完全9模式需要计算以确定最佳模式成本最低的率失真。为了减少计算,一些快速模式决策算法被开发出来,主要集中在如何消除不必要的模式。通过使用Sobel算子,边缘方向地图成功用于快速h国米模式选择。减少内部的计算预测[9]。在[10],提出了客观测量内部和国米之间的模式来决定空间和时间相关性。最近,基于运动内容分类的快速模式决策算法在[11],这使得使用空间模式的相关性预测当前宏模块的最可能的模式。大多数发达快速模式决策算法涉及额外计算这样的边缘方向地图,系数少成本或模式预测消除可能的模式,这可能会增加复杂性,在实际实施,特别是使用硬件。本文的码率编码国米16 x16模式提出了简单和复杂运动块分类和不同模式搜索订单和终止计划是用来消除不必要的模式。Inter16x16模式的编码率失真优化模式选择过程的一部分,因此不需要额外的操作模块提出了快速算法。 |
剩下的纸是组织与第二部分提供使用率运动内容分类的原因。提出了快速算法和阈值选择第三节中描述。新的快速选择算法在第四节内进一步加速决策过程。仿真结果提出了部分V和VI节中给出的结论是。 |
率宏模块运动内容分类 |
在h,大多数的计算成本花在那些并不是最终的模式最佳模式;因此,为了减少计算,一个好的方法是提前排除一些看似不太可能的模式。基本上,宏模块(MB)可分为两种类型:简单运动宏模块(SMB)和复杂运动宏模块(招商银行)。这是一个粗略的运动内容分类,因为我们不能精确地确定最佳方式提前[11]。如果一个MB是SMB,只有大型的模式(跳过,Inter16×16日Inter16×8日和Inter8×16)选择最好的模式。类似地,招商银行仅覆盖小块的模式(Inter8×8,国际米兰8×4,Inter4×8, Inter4×4, Intra4×4和Intra16×16)。这种模式搜索策略可以避免很多计算尤其是MB和SMB预测。在这样的条件下,计算的率失真代价小块的模式可以节省计算量比大的块的模式。利用这种模式搜索方法,尽管如此,我们需要开发一个高效和准确性测量SMB和招商银行的分类。在h,率失真代价是用于决定最好的方式,它被定义为 |
(1) |
λ是拉格朗日乘子,SSD礼物的平方的总和区别原始MB和重建MB, Rmotion代表运动矢量的编码比特数和头部信息,和Rresidue代表了残渣进行编码的比特数MB。基于代价函数的定义,我们可以考虑使用JRD, SSD, Rmotion, Rresidue运动内容的分类。我们想要一个高效的分类器,总成本JRD和SSD不是优秀的求职者。这是因为SSD的计算非常密集的计算需要向前/逆量化,向前/逆变换和pixel-reconstructions过程[12]。除了高计算要求,SSD还不能提供非常决定性的信息模式决定。因此,SSD块模式分类并不是一个好选择。同样,Rmotion编码运动矢量的比特数,这也不是高度相关的最终模式决定。 |
h带来可变块模式的原因是,在某些情况下当前MB无法预测的大模式,这意味着当前和预测的区别MB是相当大的。因此,我们必须采取小模式更好的估计。Rresidue是渣块的熵编码后的比特数。是直接相关的原始和预测MB的区别。因此,等大的块大小Rresidue Inter16x16模式可以是一个很好的衡量分类MB的运动内容的快速模式选择。例如,如果Rresidue Inter16x16模式很小,这意味着很大块的模式可以预测当前MB,那么很可能当前MB应该一栋SMB和最好的方式是在大型模式;否则,我们应该关注小块的模式确定最佳模式。基于这个想法,我们选择的码率编码Inter16x16渣块(RInter16x16)作为衡量SMB和招商银行分类,然后使用不同的模式搜索命令,节省一些不必要的计算模式。分类可以基于一个预定义的阈值如下: |
如果RInter16x16 <阈值,那么当前MB是SMB;如果RInter16x16≥阈值,那么当前MB是招商银行;为了证明RInter16x16可以提供很好的分类精度,分类精度的QCIF序列见表我和量化参数(QP) = 32和阈值= 140。 |
MB的正确比例的比例分类符合获得详尽的模式选择的结果;SMB误差率的比例是SMB误分为CMBs,和相反的比叫做CMB误差率。从表1中,我们可以发现,当正确的阈值选择,正确分类率非常高,可达到98%。 |
提出了快速国米16 x16率模式选择算法 |
基于RInter16x16运动内容的分类,我们可以使用不同的模式搜索订单,以避免一些不必要的模式实现快速计算模式的选择。提出了快速Inter16x16率模式决策算法首先计算当前的RInter16x16 MB,然后将它与一个预定义的阈值进行比较。如果RInter16x16小于阈值,确定当前的块作为SMB涵盖大型模式; |
如果RInter16x16小于阈值,确定当前的块作为SMB涵盖大型模式;否则,它是一个CMB涵盖小的模式。快速算法可以概括为: |
第一步:计算残留块RInter16x16 Inter16x16的码率模式 |
步骤2:如果RInter16x16 <阈值选择的最佳方式直接/跳过,Inter16x16, Inter8x16和Inter16x8模式基于率失真代价。 |
步骤3:如果RInter16x16≥阈值然后选择最好的方式从InterP8×8 (Inter8×4, Inter4×8, Inter4×4), Intra16×16和Intra4×4模式基于率失真成本。 |
提出了快速模式决策算法的流程图见图1。与使用这种搜索订单,可以节省大量的计算由于不必要的和计算密集型模式尤其是内部模式计算是可以避免的。此外,该算法在硬件和软件很容易实现,它不需要额外的模块因为RInter16x16的计算是一个必要的步骤,率失真代价计算的过程。在该算法如上所述,我们选择的原因Intra16x16模式在招商银行路径是,当Inter16x16模式的预测精度是足够好,我们不需要诉诸Intra16x16模式,这只是大栋的补偿模式。 |
有效地应用该算法,我们必须解决如何选择好的阈值不同的每秒,这可能对计算时间和率失真性能有很大的影响。的分类准确性和编码率失真性能提出了快速算法使用各种每秒和阈值如表2所示。从表2,我们可以发现QP值越大,正确的比例越大,从而导致一个非常类似的编码性能与原始算法提出了快速算法。此外,RDO性能阈值的选择不是很敏感。以QP = 36为例,只要我们选择一个阈值在[90150]的区,RDO性能非常稳定。这个属性是重要的因为我们没有尽力多关于如何精确地确定最佳阈值。与广泛的模拟不同类型的视频序列和每秒,制定阈值之间的关系和每秒如下方程: |
(2) |
公式是合理的因为当QP增加时,增加导致小RInter16x16量化步骤。因此,我们必须降低阈值调整RInter16x16越小。 |
快速内部4 x4模式选择算法 |
内部预测意味着当前宏模块的预测来自于空间信息的已编码宏模块在同一图像[13]。主要导致I-frame编码和也是一个重要的预测方式P-frame B-frame当国米预测不能很好地工作。16 x16内部预测工作在慢慢变化的区域。在内部4 x4模式中,有九个完全预测模式支持,如图2所示。八个预测模式为一个特定的预测方向和一个模式是直流的预测模式。在h标准,一个完整的搜索(FS)检查所有9模式用于内部4×4预测找到成本最小的RD的最佳模式。因此,对于宏模块中组件亮度,我们必须检查16×9 = 144种不同的RD成本计算;在FS,国米预测需要计算七RD的成本。的比较,我们可以发现,计算负载内部4 x4模式是相当大的,因为有太多的模式。因此,如果我们可以排除一些不必要的提前预测模式,更可以节省计算时间。 To accelerate the coding process, the JVT reference software version JM 6.1d provides a fast SAD-based cost function [14]: |
(3) |
,悲伤和绝对的区别是原来的块和预测块P和K等于0 1可能的模式,其他模式。表达的悲伤 |
(4) |
sij和j (i, j) th元素当前原始块年代和预测块的P,分别。这个SAD-based成本函数可以节省大量计算图像块变换的过程,量化,重建可以得救。此外,估计是常数的比特数等于4或0。因此,可变长度编码使用CAVLC或CABAC也可以得救。然而,减少计算的费用通常有相当显著的退化的编码效率。为了达到更好的ratedistortion性能,JM6.1d也提供了另一种SATD-based成本函数[14]: |
(5) |
在饱和的和绝对的Hadamard-transformed区别原来的块和预测块P,给出的是哪一个 |
(6) |
hij在哪里(i, j)的阿达玛变换图像块H th元素之间的区别是原来的块和预测块p·阿达玛变换块H的定义是 |
(7) |
实验结果表明,该比JSAD JSATD能够实现更好的率失真性能,但它需要更多的计算由于阿达玛变换。然而,饱和的仍然是大的性能下降;因此,我们提出一个新的内部4 x4模式快速选择算法。在许多情况下,最好的内部预测模式发现的完整的搜索是不一样的,从饱和的标准;然而,很可能真正的最佳方式是最小的K模式中饱和的标准和定义等概率P,如表3所示。从表中,我们可以发现,当K = 3时,概率P是0.85。根据这个结果,我们提出一个快速内部4×4模式选择算法如下: |
步骤1:计算饱和的九个内部4 x4的预测模式的成本; |
步骤2:挑出K模式成本最小的饱和的收集在集; |
步骤3:计算RD成本在这些模式的设置和确定最佳预测模式。 |
在该算法中,计算的复杂性饱和的成本远远低于RD和我们仅仅需要检查K模式而不是完整的搜索。因此,计算时间可以减少很多。 |
仿真结果 |
提议的模式选择算法进行了测试使用前50帧视频从不同类型的使用不同视频序列中的前50帧(Akiyo,工头和Stefan汽车无线电话,特雷弗,推销员e.t.c)所有QCIF格式的慢动作,介质运动和快速运动的细节。实验在JVT JM12编码器进行[14],测试参数如下文字: |
——以前的帧数用于国际运动搜索是1, |
——CAVLC启用, |
- - - - - -共和党结构IPPPIPPP…, |
——马克斯搜索范围是32岁 |
28 - QP值是24日,32岁的36到40,有经验和相应的阈值计算公式:55岁,81年,120年,169年,230年和303年,在快速模式选择算法内,我们做实验的K = 2, 3, 4。 |
相比与原h / AVC编码器的率失真优化和计算时间,该算法实现大型计算时间减少平均r d性能非常相似,在表4中列出(Akiyo的顺序),表5(领班)的顺序和表6 (Stefan的顺序)。当只有快国米模式选择算法,在Akiyo和工头,减少计算平均可以达到62%以上,平均0.04 PSNR下降和平均比特率增加0.2%,在斯蒂芬,减少计算平均达到47%,平均0.02 PSNR下降和平均比特率增加0.12%。当我们把国米模式和内模式快速选择算法结合在一起的K = 2、3和4,可以进一步减少计算时间,一个小r d性能的退化。 |
表中所示的结果表明,K = 3可以导致更好的权衡计算负载和性能比r d K = 2或4。 |
从仿真结果中,我们可以总结阈值由方程(2)广泛适应不同类型的视频序列:慢动作、中运动和高运动。这也表明,阈值不敏感的QP值。该算法可以减少更多的慢动作序列的计算时间比更高的运动序列。这是因为有更多的大宏模块的慢镜头序列模式,所以那么多计算模式可以跳过小,尤其是内部模式,有很大的计算量。当QP值减少,增加r d性能的退化。 |
从表2,我们可以发现,在大型QP价值观,正确分类的比例更高,这决定了r d的降解性能。因此,一个更小的QP导致较小的正确分类的比例和RD性能差。表第七,第八和第九节目r d性能和计算时间的三个传统的快速模式选择算法:跳过模式提前终止算法,快速内部模式决策算法和快速国米模式决策算法[10]、[11][12]。结果表明,我们的算法有更好的权衡r d性能和计算负载。 |
结论 |
摘要高效快速国米和内部提出了h标准模式选择算法。快速国米模式算法,动机是跳过一些看似不太可能的模式,将宏模块划分为招商银行和基于编码的码率的SMB Inter16x16模式渣块(RInter16x16)。阈值用于分类也由一个方程制定相关异同,从而保持良好的权衡计算复杂和率失真性能。快速内部模式算法的贡献是检查三个最可能预测模式内而不是完整的搜索。实验结果表明,该算法实现节省大量计算,同时保持了非常相似的率失真性能。 |
表乍一看 |
|
|
|
|
|
表1 |
表2 |
表3 |
表4 |
表5 |
|
|
|
|
表6 |
表7 |
表8 |
表9 |
|
|
数据乍一看 |
|
|
图1 |
图2 |
|
|
引用 |
- 伊恩•理查森如,”H。264and MPEG-4 video compression:新一代多媒体视频编码”,奇切斯特:约翰·威利和儿子c2003。
- t . Wiegand G j·沙利文,GisleBjontegaard Ajay Luthra”概述h / AVC视频编码标准,“IEEE反式电路和系统视频技术,13卷,pp.560 - 576, 2003年7月。
- Watkinson,约翰,“mpeg - 2”,牛津大学,波士顿:焦出版社,1999年。
- 佩雷拉,费尔南多·c . N。,“The MPEG-4 book”, Upper Saddle River, N.J.: Prentice Hall PTR, c2002.
- V登,T。,“H。261and MPEG1-a comparison”, Proceedings of the 1996 IEEE Fifteenth Annual International Phoenix Conference on 27-29 March 1996 Page(s): 65 – 71.
- 对低比特率视频编码通信(ITU-T建议h .版本1,1995年),1997年9月
- t . Wiegand M。d·慕克吉T.G. Lightstone坎贝尔,”栏目密特拉”,率失真优化模式选择极低比特率视频编码和新兴h标准”,IEEE反式,电路系统。视频抛光工艺。,vol.6, no,2, pp.182-190, Apr.1996
- g . j . Sullivian和t . Wiegand“视频压缩率失真优化”,IEEE信号的过程。15卷,杂志。11,pp.74-90, Nov.1998.
- f·潘,林x r . Susano k . p . Lim李振国李,g . n·冯·d·j·吴,吴和美国,“快速模式决定内部预测,”联合视频小组(JVT) Mar.2003,医生。JVT-G013
- 伙夫Lim等,“快速国米模式选择”,联合视频团队,Sept.2003,医生。jvt - 120
- 全和j·李,“快h模式决定,”联合视频小组(JVT) Dec.2003,医生。JVT-J033。
- 明,分析师Wensheng王,“快速宏模块模式选择基于h / AVC”运动的内容分类,IEEE Proc。ICIP,第744 - 741页,2004年10月
- a . Hallapuro m . Karczewicz“低复杂性变换和量化-我:基本实现“,ITU-T Q.6 / SG16 DocumentJVT-B038, 2002年1月
- 联合视频团队(JVT)参考软件,http://iphome.hhi.de/suehring/tml/index.htm
|