引言
运动估计是视频压缩的关键,能进一步减小图像的冗余度,提高编码压缩效率。运动估计就是在帧间预测时设法找到当前帧的像素(或图像块)是从上一帧图像的什么位置移动过来的,以该位置上的像素(或图像块)作为预测依据,以此提高预测的准确性。由于H.264中的运动估计采用了一系列新技术,如七种块尺寸(将一个宏块分割成16×16、16×8、8×16、8×8、8×4、4×8、4×4七种类型的子块进行运动估计)、1/4像素精度运动补偿技术和多参考帧技术等,在使压缩效率至少提高两倍的同时,计算量也大大增加。实验结果表明,运动估计占H.264编码器的60%~80%的时间。H.264中的运动估计由整数运动估计和分数运动估计两部分组成。由于不论是自然视频图像序列或是合成视频图像序列,实际对象的运动精度都是任意小的,所以引入分数运动估计能非常准确地描述对象的运动轨迹,能更进一步去除视频图像序列的时间冗余,其精度达到了1/8像素精度。分像素的运动矢量如图1所示。
图1 分像素运动矢量
一般在实际应用中,运动估计普遍采用分级搜索算法:首先在搜索区内找到最佳整像素运动矢量,再在整像素最佳匹配点下寻找最佳1/2匹配点,得到半像素精度的运动矢量,接着在该半像素精度最佳匹配点周围进行1/4像素点搜索,得到1/4像素精度最佳匹配点以及相应的运动矢量。由于分像素运动估计运算量大,很多学者对分像素运动估计从算法上进行优化,提出了很多快速搜索算法,减少搜索点数目以达到降低运算复杂度的目的。本文就是基于这个目的,在块匹配算法的基础上,提出了一种1/4像素精度的亚像素运动估计的硬件实现方法。在整像素运动估计的基础上用10×10整像素阵列实现半像素精度和1/4像素精度的最佳匹配点搜索,在空间上具有更高的并行度,硬件实现简洁有效。
FME的运动矢量
帧间编码宏块中的每个块或亚宏块分割区域都是根据参考帧中同尺寸的区域预测得到的,它们之间的关系用运动矢量来表示。H.264对亮度成分和色度成分进行亚像素搜索时,两者之间的运动矢量是有差异的,对亮度成分采用1/4像素精度,色度成分采用1/8像素精度。如图2所示,大写字母代表整像素点,小写字母代表1/2像素点。
图2 亮度半像素内插
假定点H是在整像素运动估计中找到的最佳匹配点,在此基础上再进行1/2像素点的搜索,如点(bb,aa等),如果MV的垂直和水平分量为整数,参考块相应像素实际存在;如果其中一个或两个为分数,则参考块相应的亮度和色度像素并不存在,需利用邻近已编码点进行内插而得。
内插像素生成的步骤如下:
首先生成参考图象亮度成分的半像素点。半像素点(如b、h、m)通过对相应整像素点进行6抽头滤波得出,权重为(1/32、-5/32、5/8、5/8、-5/32、1/32)。b通过下式计算得出:
b=round((E-5F=20G+20H-5I+J)/32) (1)
类似的,h由A、C、G、M、R、T滤波得出。一旦邻近(垂直或水平方向)整像素点的所有像素都计算出来,剩余的半像素点便可通过对6个垂直或水平方向的半像素点滤波得到。例如,j由cc、dd、h、m、ee、ff滤波得出。
半像素点计算出来后,在此基础上,1/4像素点可通过线性内插得出,如图3所示。
图3 亮度1/4像素内插
1/4像素点(如a、c、i、k、d、f、n、q)由邻近像素内插而得,如
a=round((G+b)/2) (2)
剩余1/4像素点(p,r)由一对对角半像素点线性内插得出,如e由b和h获得。相应地,对于色度成分的1/8像素精度的运动矢量,也同样通过整像素点线性内插得出,如图4所示。
图4 色度1/8像素内插
其中:
a=round([(8-dx)(8-dy)A+dx(8-dy)B+(8-dx)dyC+dx dyD]/64) (3)
FME模块算法原理及硬件实现
在本设计中,FME搜索采用的是如图5所示的菱形全搜索方法。
图5 菱形全搜索