1 引言
Gabor小波在空间域和频率域均有较好的分辨能力,有明显的方向选择和频率选择特性。随着人们对Gabor小波技术的不断探索,使该方法在人脸识别领域取得良好的识别效果[1,2]。本文首先通过直方图均衡化等预处理过程使图像更加清晰,然后通过调整小波变换系数进行特征提取。本文主要的目的是减少系统运算量、提高人脸识别的准确率。
2 人脸特征提取的基本原理
在特定的场景中对人脸进行定位是特征提取的第一步。神经网络法、彩色分析法、Hough[3]变换法、模板匹配法、灰度分析法、几何模型法和主元分析法等方法是目前比较流行的人脸特征定位方法。由于色彩在人脸不同位置的差异,在定位人脸位置时(如嘴唇的红色分量相对较高等),应选用色彩分析的方法。该方法针对不同的色彩模式的图像进行分析处理,使图像更加的清晰,其它人脸识别方法均可用灰度图像分析的方法进行处理。
实验中选取的人脸表情图像排除了眼镜、头发等遮挡物的影响,因此所选用的图像适合灰度图像分析的方法进行处理。通过图像灰度的垂直积分确定人脸图像的上下边界;通过图像灰度的水平积分确定人脸图像的水平边界。相应的,垂直积分投影的计算是根据图像每列的灰度和值,而水平积分投影的计算是根据水平方向的灰度和值。
图像水平积分和垂直积分的公式为:
其中,H(x)表示图像在[y1,y2]区域的水平积分投影,V(y)表示图像在[x1,x2]区域的垂直积分投影。G(x,y)为被积函数。
3 人脸图像的预处理
图像预处理主要有以下两个方面的作用:第一,通常情况下,由于光照、噪声等因素的影响,使得到的原始图像质量并不理想。这就需要在特征提取之前要对图像进行预处理,使原始图像特征清晰并提高识别系统的识别效率。由于系统的不足和环境的影响,在提取有用的信息的时候会受到各种因素的影响,对此我们要采取不同的有针对性的措施进行图像预处理。第二,我们得到的图像本身不满足系统的要求,主要体现在图像的大小、角度等方面。这也要求我们对图像进行必要的处理。综上所述,图像预处理是一个相当重要的过程。因此,我们在对图像预处理时应该采取正确合理的方法。不同的环境应该采取不同的预处理方法,预处理的模块也应依据系统自身的特点进行设计。如果预处理方法不合适不但不能弥补系统的不足还会影响识别结果;相反,预处理做的太复杂,运算过多,就会增加工作量。所以预处理时应该综合考虑各方面的因素。
3.1 几何校正
在人脸库中提取的原始图像,由于受到外界因素的干扰,会使图像中面部的大小和位置造成很大的差异。这主要是由被拍摄人的位置、姿态、光照和成像距离等因素造成的。为了满足识别系统算法对图像质量的要求,必须对原始图像进行一定的技术处理,否则会影响整个系统的顺利运行,对算法识别的准确率造成很大的影响。主要包括以下几种方法对图像几何校正:
一、图像的平移:就是按照一定的规则,在二维平面坐标内,对图像做垂直移动或水平移动,减少因为人脸的偏移对识别结果造成的影响。
二、图像的翻转:为了解决有的图像中人脸的上下颠倒的现象,利用图像翻转来纠正图像中人脸的位置,达到识别系统的要求。图1原始图像、图2 为翻转后的图像。
三、图像的旋转:主要方法就是根据实际需要以图像的中心为原点,对图像旋转某个角度的处理。图像旋转中有时候一些点会转出视图区外面,而另外一些点会被转进来。如果转出视图区的点很重要,那么可以通过增大能显示出来的图像的范围来达到实验的需要;如果不重要,那么就可以直接截取。
其中,(x,y),(x’,y’)是旋转前后图像中同一像素的坐标,θ是旋转角度。图像的旋转都是绕坐标轴原点进行的,如果对某个点进行旋转,那么首先要将该点平移至坐标原点。图3为原始图像、图4 旋转后的图像。
3.2 直方图均衡化
直方图概念:直方图(histogram)是灰度级的函数,它表示图像中具有每种灰度级的像素的个数,反映图像中每种灰度出现的频率(像素的个数)。一幅图像的概貌可以用直方图描述(如图像灰度分布情况、灰度的范围)。对原始人脸图像采用直方图描述时,特征点相对集中,不利于系统识别。直方图均衡化是一种最常用的直方图修正方法,通过把给定图像的直方图的分布改造成均直方图分布,使输出像素灰度的概率密度分布均匀。均衡化之后的图像是拥有最大嫡(信息量)的图像,这是从信息学角度出发得到的基本理论。通俗的说,图像的对比度增加是直方图均衡化后最直观的效果。
在图像均衡化时,图像亮度即图像矩阵的平均值是很重要的参数,其值越小则对应图像越暗;而图像对比度就是图像矩阵的均方差(标准差),对比度越大,图像中黑白反差越明显。均衡化可以在一定程度上消除成像条件不同,即图像光照不同对识别造成的负面影响。图5原始图像及直方图;图6均衡化后的图像及其直方图。其中,灰度直方图的横坐标表示灰度级,纵坐标表示该灰度级出现的频率。
4 基于小波变换的特征提取
4.1 Gabor小波
1980年,Dogmas 提出了2-D Gabor滤波器,该滤波器具有一组不同参数,可以捕捉到显著的空间局部调制特性和方向选择特性。二维Gabor滤波函数在空间域和频率域中具有良好的分辨能力,具备提取图像局部信息变化的能力[4],同时,Gabor小波变换对光照和图像的变形有较好的鲁棒性,因此在图像处理中有广泛的应用。
二维Gabor小波的表达式为:
小波的实部和虚部对一幅图像的卷积结果如下:
图7为从人脸图像库中提取的原人脸图像;图8为经过二维Gabor小波变换后得到的模板图;图9、图10分别为Gabor小波的幅值与相位。
4.2 识别过程
在人脸图像的识别过程中,特征提取是最关键的一步。特征提取的目的是把用像素描述的图像转化成更加高级的描述方式,使图像得到更加具体的解释。例如:我们可以通过颜色、形状、大小、空间构造或者是纹理特征对图像进行描述,在图像具有一定稳定性和高识别率的情况下,对图像数据进行降维处理。本文所用的识别方法为:
首先,输入人脸图像样本利用Gabor小波变换把输入的样本图像变换为对应的特征矢量Ji,然后计算得到样本的均值向量最后根据特征矢量通过比较数据库中人脸样本图像与待识别人脸图像之间的距离得到最大相似度,完成识别过程。本文通过选取不同的Gabor小波变换系数进行大量的试验,最终确定了一组比较合理的系数(比如Gabor小波的尺度、方向和相位等系数),提高了系统的运行速度和准确率。
5 测试实验
本文实验采用的人脸图像都是从国际上已经创建的人脸图像数据库中提取的,在IBMPentiumlll1.20GHz微处理器,内存为512的XP操作系统上,用Matlab编程的。实验内容为:从原始人脸库中选取实验所用的样本,样本中包括15个测试者的图像,每个测试者有9 幅图像组成的特征序列,共800张图像,包含160个目标。 从样本中选取每个测试者的5 幅图像作为训练样本集,其余图像作为测试集。每次试验系统都运行十次取平均识别率。Gabor小波系数取值如表1所示。
人脸特征点的位置如图11所示:
实验主要对经验预处理和未经过预处理的图像的识别结果进行对比,实验结果证明由于图像经过预处理以后减少了大量的冗余信息,降低的图像的维数,使图像识别的准确率和识别速度都有很大的提高,从而证明在人脸识别前对图像做预处理的必要性。经过预处理的图像的识别效果如表2,未经过预处理的图像的识别效果如表3。
实验结果表明,人脸图像经过预处理后在识别率和识别速度上都有很大的提高。这说明在对人脸图像进行识别前的图像预处理工作十分重要,它能使图像达到理想的识别效果。另外本文对传统的利用小波变换进行人脸识别的技术进行改进,通过大量的试验得出一组比较合理的小波变换系数,提高人脸特征提取的速度和准确率。
参考文献:
[1] I.Cohen,A.Garg, S.T.Huang. Emotion Recognition from Facial Expressions using Multilevel HMM[J].IEEE transactions on pami,2002,11(12):564-569.
[2] 边肇棋,张学工等,模式识别(第二版)[M].北京:清华大学出版社,2000:223-227.
[3] C.L.HUANG,Y.M.HUANG.Facial Expression Recognition Using Model-Based Feature Extraction and Action Parameters Classification.J[J].Visual Comm and Image Repressentation,1997,8(3):278-290.
[4] 成礼智,王红霞,罗永编著.小波的理论与应用[M].北京:科学出版社,2004:278-282.
[5] M.LYONS,J.BUDYNEK,S Akamastu.Automatic Classification of single Facial Images[J].IEEE Trans on Pattern Analysis and Machine Intelligence,1999,21(12):1357-1362.
作者简介:张秀艳(1976-),女,副教授,工学硕士,主要从事无线通信、信息处理方面的研究。