1 引言
大豆是一种极易染病的作物,一般病害使大豆减产10%-20%、严重的可达到30%-50%、甚至绝产。自20世纪80年代,科研人员已将数字图像处理和模式识别技术[1]应用于作物病害诊断中。图像分割是图像分析和模式识别的基础,图像分割的好坏直接影响图像识别的精度。
图像分割处理就是指将数字图像划分成一系列有意义的互不相交的目标或区域过程。传统的图像分割算法一般是基于亮度值的两个基本特征:不连续性和相似性,如基于不连续性的图像边缘的检测和基于相似性的闭值处理和区域增长等[2]。图像分割技术自20世纪70年代起,一直受到人们的重视,至今已经提出了上千种图像分割的方法,但是图像分割技术至今仍然没有通用的理论,人们都根据实际的需要,采用不同的分割方法。本文分两步对大豆叶片病斑图像进行分割,首先,采用阈值法将病害叶片图像从背景中分割出来,然后,再采用遗传神经网络方法快速、准确地获得病斑图像。
2 大豆病叶样本图像采集
在东北农业大学教育部大豆生物学重点实验室实验基地与黑龙江省农业科学院合江研究所通过人工接种的方式,培育纯正的大豆灰斑病植株样本,从发病初期到发病非常严重这段时间进行样本图像采集,建立大豆灰斑病叶片样本图像库。平均每隔一天采集一次,每次都选择上午的7-9点之间进行,因为这段时间光线比较好,而且叶片的水分也比较多,采集的图像效果比较好。
3 病害叶片与背景的分割
3.1 图像灰度化
由于病害叶片与载物台背景存在着显著的颜色差异,为了简化问题,首先采用色彩系统变换法将彩色图像转化为灰度图像。如图1所示:
3.2 图像二值化
通过对灰度图像的分析,发现叶片与背景的灰度差异显著,因此,统计灰度图像的直方图,如图2所示,直方图的横坐标代表图像的灰度,纵坐标代表各个灰度出现的频率。因为直方图有明显的双峰性,两峰之间的波谷,即灰度出现频率最小的地方,就是图像分割的阈值。根据阈值将图像分割成二值图像,分割后的图像在叶片的区域内可能存在着一些细小的随机噪声。所以,采用区域填充法滤除噪声,滤波后的二值图像如图3所示。
将原始图像与二值图像进行对照,如果二值图像的像素点值为1,那么将原始图像对应的像素点的R、G、B三个分量值都设置为255,如果二值图像的像素点值为0,那么原始图像对应的像素点的R、G、B三个分量
值保持不变。这样我们就将病害叶片从背景中分割出来了,分割结果如图4所示。
4 基于遗传神经网络的叶片病斑的分割
遗传算法和人工神经网络都是将生物学原理应用于科学研究的仿生学理论成果,具有极强的解决问题的能力。尽管二者的产生都受到自然界中信息处理方法的启发,但来源并不相同,遗传算法是从自然界生物进化机制获得启示的,而人工神经网络则是人脑或动物神经网络若干特征的抽象和模拟[3]。两者的结合弥补了各自的缺陷,发挥了各自的优势。
4.1 颜色特征的选取
然后将病害叶片彩色图像分解为R,G,B三个分量图像,如图5所示。从R,G,B三个分量图中分析发现RGB颜色空间的R,G,B三个分量图像受光照的影响很大,暗处出现黑斑,图像的白色噪声难以消除。为了解决这一问题,把RGB颜色空间转换到HSI和YUV颜色空间。在HSI空间可以从彩色图像携带的彩色信息(色调和饱和度)中消除亮度分量的影响。如图6所示。分析H,S,I的分量图像,可以看出H分量的图像病斑和叶片背景差异最大,并且H分量有效的抑制了噪声以及光强不均匀对图像的影响,S和I分量图都不同程度的受到噪声的影响,所以可以选择H为图像的一个特征值。Y,U,V各个分量图像如图7所示。颜色空间转换后,经观察发现U,V分量图像叶片背景区均匀,受光照的影响比较小。所以可以选择U,V为特征量。
神经元网络的结构和权值被映射到该染色体上,其中隐含层为一层,隐含层结点数根据实际应用的需要确定,W为输入层到隐含层的权阵,V为隐含层到输出层的权阵,仍按照由行到列的顺序排列,编码方式采用二进制。这样进行遗传编码的结果虽然增加了染色体串的长度,但每个基因的值简化到只有0和1两种变化,显著提高了算法的全局搜索能力。
4.2.2 适应度函数的确定及其比例变换
应用遗传算法生成神经元网络的第二个关键步骤是确定适应度函数,以评价由一个特定染色体串表示的神经元网络解决问题的能力。本文利用神经元网络输出值的均方误差MSE这个代价因子来生成目标函数,然后通过倒数变换将其转换为适应度函数,目标函数的计算公式为:
2. 交叉。
本文采用一点交叉。具体操作是:在个体串中随机设定一个交叉点,实行交叉时,该点前或后的两个个体的部分结构进行互换,并生成两个新个体。
3. 变异。
就二值码串而言,变异操作就是把某些基因座上的基因值取反,即1→0或0→1。
4.2.4 参数控制[5]
控制参数包括群体规模和交叉、变异概率,初始隐层结点数,最大隐层结点数等。
对于大豆叶片病斑分割的遗传神经网络问题,输入结点数是3,即每个像素的H,U,V的值,输出结点数是1,如果网络的输出为1,则表示该像素点为病斑部分,如果网络的输出为0,则表示该像素点为叶片背景部分,初始隐层结点数取3,最大隐层结点数取15。
从采集的大豆病害叶片样本中选取30幅图像作为训练样本,其中灰斑病、霜霉病和细菌性斑点病各10幅。
经选择、交叉、变异的反复演化过程,最终得到网络
的最优隐含层结点数为8,故有效的网络结构为3-8-1,将对应的连接权值存入权文件中。利用MATLAB工具软件中的神经网络工具箱[6],编写具有与上述同样结构的用BP网络训练的多层前馈网络进行训练,其训练过程同遗传算法训练的神经网络比较如图10所示。
最后,把在自然光下采集到的大豆病害叶片图像去除背
景、提取特征后,用已经训练后的神经网络进行分割,分割
结果如图11所示。从大豆病害叶片图像库中随机抽取灰斑病、霜霉病、细菌性斑点病样本图像个50幅进行分割测试,经验证准确分割率达到98 %以上,完全可以满足大豆叶部病害诊断的要求。
5 结束语
实验证明,本文使用的MGA-BP神经网络的图像分割方法是一种可行的分割方法,该方法在引入遗传算法以后大大提高了神经网络的训练效率,具有较高的收敛速度和较强的鲁棒性,通过对图像的高效处理,从中获取重要信息,有着广阔的应用前景,将其用于对复杂场景的目标的分割也会取得很好的效果。
参考文献:
[1] 管泽鑫,姚青,杨保军等.数字图像处理技术在农作物病虫草识别中的应用[J].中国农业科学,2009,42(7):2349-2358.
[2] RAFAEL C.GONZALEZ,RICHARD E.Woods.2002.Digital Image Processing[M].北京:电子工业出版社,131-152.
[3] 梁化楼,戴贵亮.人工神经网络与遗传算法的结合进展及展望[J].电子学报,1995,23(10):194-199.
[4] 杨秀坤.农产品品质检测中的人工智能方法研究[D].长春:吉林工业大学,1997.
[5] 张晓绩,戴冠中,徐乃平.一种新的优化搜索算法——遗传算法[J].控制理论与应用,1995,12(3):265-271.
[6] 蒙以正.MATLAB 5.X应用与技巧[M].北京:科学出版社,1999:201-216.