报道:视频编码标准H.264的核心技术是什么?

最近小编看到大家都在讨论视频编码标准H.264的核心技术分析相关的事情,对此呢小编也是非常的感应兴趣,那么这件事究竟是怎么发生的呢?具体又是怎么回事呢?下面就是小编搜索到的关于视频编码标准H.264的核心技术分析事件的相关信息,我们一起来看一下吧!

标签:熵编码 H.264


(资料图片)

H.264/AVC建议是目前最新的视频压缩标准。本文首先简要介绍图像通信中,视频编码标准H.261和H.263建议的基本原理和主要特点。

然后详细分析研究了H.264建议中的关键技术,包括帧内帧间预测编码、去块效应滤波、可变块大小、多帧和亚像素运动估计、整数DCT变换以及新的熵编码等新技术。

前言

图像通信是近年来取得长足发展的现代通信技术,图像压缩的进步则是通信发展中的重要组成部分。国际标准建议H.261的问世,是对图像编码近40年研究成果的总结,解决了可视技术在通信中的应用这一长期困扰人们的问题,覆盖了整个窄带ISDN上视听业务的图像编码,极大地推动了会议电视、电视电话等图像通讯方式的国际化和产业化。随后,ITU在H.261建议的基础上着手极低码率图像压缩的标准,制定了H.263建议,以及最新的H.264/AVC。本文首先对H.261和H.263建议的基本原理进行阐述,然后对新标准H.264/AVC中的新技术进行说明,最后再对H.26x系列标准进行总结。

1 H.261建议的基本原理

每一个图像压缩标准的制定,都针对它最适合的应用目标。H.261是最早定义的视频编码标准。它首次使用了运动补偿预测编码与DCT变换相结合的方法,其视频编码信号的传输速率从64kbps到1.92Mbps,故为p×64K视频编码器(p取值在1~31之间)。H.261主要应用于ISDN网上的视频会议系统,定位在电路交换网络系统。H.261编码器的原理如图1所示。

该建议主要采用CIF图像分辨率格式和QCIF分辨率格式, 以解决不同制式通信间的兼容问题。对于每一个帧间编码的宏块,H.261采用运动补偿的帧间预测算法,消除电视图像时间域上的相关性;对预测误差进行DCT变换以消除图像空间域上的相关性;然后自适应量化DCT系数,以充分利用人的视觉特性;接着进行熵编码,以实现统计匹配编码;最后采用输出缓冲存储器,以平滑数码流,达到输出数码率保持恒定的目的。

该建议的图像帧编码模式包括I,P,B三类。I帧,采用帧内编码方式;P帧,采用帧间编码方式,由I帧或前面的P帧进行运动补偿,再对误差估计进行编码;B帧为双向内插帧不编码传输,而由I帧和P帧或者P帧与PP帧插值重建。H.261不支持双向运动预测以及GOP,每一个帧间编码帧是以它的前一个已编码帧为参考帧。

H.261标准的编码数据结构从高层到底层定义了四个层次,即帧层、片层、宏块层和块层。H.261的运动估值补偿是以宏块为单位进行的。对某宏块是选择帧间还是帧内编码方式,首先需要判断。若它与匹配宏块相关性强,则可采用帧间编码方式,反之,则采用帧内编码方式。

2 H.263建议的基本原理

H.263标准是在H.261标准的基础上建议的。它在低码率条件下,能够在不增加太多复杂度的情况下,获得更高的图像质量。原则上它只需要一半的带宽就可取得与H.261同样的视频质量。目前,H.263标准已经被各种可视电话终端协议广泛采用。

H.263标准基本模式编码器的结构框图与H.261标准相似。同样,采用运动补偿预测减少图像的时间域冗余度;对运动补偿预测的残差场进行离散余弦变换(DCT)编码;利用变长编码(VCL)对量化的DCT系数、运动矢量以及附加信息进行熵编码。

H.263在H.261建议的基础上作了一定的改进。图像尺寸采用QCIF格式,引入了sub-CIF格式,也允许使用CIF格式。采用8×8的DCT变换,宏块统一使用同样的量化步长进行量化,可以是一个宏块使用一个运动矢量,也可以是宏块的每个子块各使用一个运动矢量,因而,具有块运动补偿能力,改善了帧间预测。运动矢量的x向和y向都支持半像素精度,运动估计的搜索窗大小被限制为[-16, +15.5],运动矢量进行差分预测编码传输。编码方式采用二维预测与VLC相结合的编码;类似MPEG-1标准,将所有的图像分为P帧和BP帧。

H.263建议为保证在极低码率条件下获得较好的图像质量,在H.261混合编码的基础上,还采用了无限制的运动矢量模式、语法基算术编码模式、高级预测模式以及PB-帧模式等编码技术。在无限制的运动矢量模式中取消了作为基准的像素必须在编码图像区域内的限制。在高级预测模式中使用了重迭块运动补偿,而且还允许运动矢量穿过运动边界。在PB-帧模式中,B帧通过前一译码P帧和当前的一个译码P帧进行双向预测重建,这样就提高了帧速率但并未明显增加比特数。以上三种方式主要是为了改善帧间预测。基于语法算术编码方式的采用是为了进一步降低传输的比特率。在这种方式中,所有的变长码的编译码运算都用算术编译的运算来代替。提供这些高级编码模式,使得应用者可以在压缩性能和复杂度之间进行均衡和取舍。

3 H.264标准的核心技术及其特点

H.264/AVC是ITU-T和ISO/IEC联合制定的最新编码标准,它最先由ITU-T的VCEG于1997年提出,目标是提出一种更高性能(相对于当时的H.263)的视频编码标准。

与先前的一些编码标准相比,H.264标准继承了H.263和MPEG1/2/4视频标准协议的优点,但在结构上并没有变化,只是在各个主要的功能模块内部使用了一些先进的技术,提高了编码效率。其主要表现在:编码不再是基于8×8的块进行,而是在4×4大小的快上,进行残差的变换编码。所采用的变换编码方式也不再是DCT变换,而是一种整数变换编码。采用了编码效率更高的上下文自适应二进制算术编码(CABAC),同时与之相应的量化过程也有区别。H.264标准具有算法简单易于实现、运算精度高且不溢出、运算速度快、占用内存小、消弱块效应等优点,是一种更为实用有效的图像编码标准。

下面介绍H.264/AVC标准在先前标准之上的新技术。H.264 标准仍采用图像预测和变换编码相结合的编码结构,其编码器的基本结构如图2所示:

编码器的工作过程可根据数据流分为前向通道和重建通道。输入帧Fn的编码,是对原始图像16×16像素的宏块进行编码。宏块编码分为帧内编码和帧间编码。在任何情况下,预测宏块P都由重建帧获得。在帧内编码模式中,P由当前帧中的已编码宏块经解码、重构预测获得,如上图中的uF’n。在帧间编码模式下,P由一个或多个参考帧经运动补偿预测获得,如F’n-1。以预测宏块P与当前宏块Fn的差值作为残差宏块Dn,经变换、量化后得到一串变换参数X。参数X需要进行两方面的处理,一是重排序和熵变换处理,整个过程没有反馈分量,故称为前向通道;二是反量化和逆变换处理,产生宏块D’n,然后与宏块P相加得到重构宏块uF’n,再经过一系列处理得到重建的参考帧F’n,用于下一帧的运动估计,因此称为重建通道。

关键词: H.264