摘 要: 工业中的温控对象普遍具有大时滞、非线性和时变性等特点,采用传统的PID控制器难以取得满意的效果。基于BP神经网络的PID控制器具有逼近任意非线性函数的能力,能实现对PID控制器的参数 , , 的实时在线整定,使系统具有更好的鲁棒性和自适应性,其输出也可以通过在线调整达到预期的控制精度,适用于温控系统。实验结果表明,该控制器具有抗干扰能力强、鲁棒性好等特点。
关键词:BP神经网络;PID控制;温度控制;在线整定
中图分类号:TP273+.2 文献标识码:A
Application of PID Controller Based on BP Neural Network in Temperature Control System
XU Li-yun
(School of Control Science & Engineering, Shandong University, Jinan Shandong 250061)
Abstract: In the industrial practice, it is difficult to achieve the satisfactory results with traditional PID temperature controller for those plants which are characteristics of large time lag, nonlinearity and time variation. A PID controller based on BP neural network has the capability in approaching any nonlinear functions, and can real-timely realize the online setting of the PID controller’s parameters , . With the optimized parameters, the control system can be of better robustness and self-adaptability, and the output of the system can reach the expected control precision through the online tuning. Thus it is suitable for temperature control. The experimental result shows that the controller is of a strong anti-jamming capability and a better robustness in application.
Keywords: BP Neural Network; PID Control; Temperature Control; Online Tuning
0 引言
温度控制系统在现代工业生产中有着广泛的应用,如塑料机械中的挤出机、锅炉控制等等。工业现场中温度的变化可能受到各方面因素的制约,而温控对象普遍具有非线性、大惯性、大时滞、扰动因素多等特点。由于传统的PID控制器受到参数整定方法不确定性的影响,参数整定往往不是最佳,致使性能不良,对运行工况的适应性较差,所以难以获得满意的控制效果。
该文描述了将传统PID控制和神经网络控制结合在一起,用于温度控制系统中,既利用了PID控制的长处,又考虑到神经网络独特的优势即神经网络可以充分逼近任意复杂的非线性关系,具有强鲁棒性、容错性和自学习等特点。这样可以在线调整PID控制器的参数,提高系统的应变能力,在一定程度上克服了PID控制参数靠经验确定及难以对复杂系统或过程进行有效控制的不足,将其应用于温度控制系统中能取得良好的控制品质,并具有较强的自适应能力。
1 基于BP神经网络的PID控制器设计
1.1 BP神经网络PID控制器结构图
基于BP神经网络的PID控制系统结构如图1所示。经典PID控制器部分,直接对被控对象过程闭环控制,并且三个参数 , , 为在线整定式;神经网络部分,根据系统的运行状态,调节PID控制器的参数,以期达到性能指标的最优化。输出层神经元的输出状态对应于PID控制器的三个可调参数 , , ,通过神经网络的自身学习、加权系数调整,从而使其稳定状态对应于某种最优控制律下的PID 控制器参数 。
图1 基于BP神经网络的PID控制系统结构
经典增量式数字PID的控制算式为
(1)
式(1)中, 为比例系数; 为积分系数; 为微分系数; 为第 次采样时刻的偏差值, 为第 次时刻被控对象的实际输出值, 为第 次时刻设定的期望值。
1.2 控制器参数的自适应整定
图2 BP神经网络的结构
BP网络采用三层结构,其结构如图2所示。它有 个输入节点, 个隐含层节点,3个输出节点。
由图2可知,BP网络输入层的输入为
(2 )
式(2)中, 为输入量个数,其值取决于被控系统的复杂程度。
隐含层输入输出为
(3)
式(3)中 为隐含层加权系数; 为活化函数。上角标(1)、(2)、(3)分别表示输入层、隐含层、输出层。隐含层神经元的活化函数取正负对称的Sigmoid 函数。
(4)
网络输出层的输入输出为
(5)
式中, 为输出层加权系数; 为输出层的活化函数。3个输出节点分别对应于PID控制器的三个参数 , , ,由于 , , 不能为负,所以输出层神经元活化函数取非负的Sigmoid 函数。
(6)
取性能指标函数为
(7)
按照梯度下降法修正网络的权系数,即按 对加权系数的负梯度方向搜索调整,并附加一使搜索快速收敛全局极小的惯性项,则有
(8)
式中 为学习速率; 为惯性系数。
(9)
一般地,由于对象特性未知且难以直接求得,所以近似用符号函数 取代。由(1)式可得
(10)
因此,由式(8)(9)(10)可得输出层加权系数的计算公式为
(11)
式中,
同理,可得隐含层加权系数的计算公式为
(12)
式中,
1.3实际数据归一化处理的改进
由于激励函数采用Sigmoid函数, 该函数的值域为 , 因此在网络训练时要将实际数据规范到[0,1]区间,通常采用标准的归一方法来实现。但是根据Sigmoid函数中间高增益、两端低增益的特性,当数据在越来越趋近于0的区域和越来越趋近于1的区域里进行学习时,恰好是Sigmoid函数的极小值和极大值。这时由于数据在饱和区段,从而需要相当多的训练次数来不断修正权值,导致训练速度缓慢,甚至出现麻痹状态。为避免这种现象, 可以将生成数据规范到 区间以此来避开饱和区段,设 , 为输入层输入实际数据的最大值和最小值,则相应的规格化后的变量为
(13)
通过式(13)来预处理实际数据,这样输入输出数据将全部在 区间,可以大大加快网络学习速度,而数据间的联系并不减少。通过实验,我们发现选用改进的归一化处理方法,效果更好。
综上所述,基于BP神经网络的PID控制算法可归纳如下:
(1) 选定BP神经网络的结构,即选定输入层节点数 和隐含层节点数 ,并选取各层加权系数的初值 、 ,确定学习速率 和惯性系数 , ;
(2) 采样得到 和 ,计算 ;
(3) 对 采用改进的归一化处理方法来处理实际数据,作为NN的输入;
(4) 根据式(2)~式(4)前向计算NN的各层神经元的输入和输出,NN输出层的输出极为PID控制器的三个可调参数 ;
(5) 根据式(1),计算PID控制器的控制输出 ,参与控制和计算;
(6) 由式(11),计算修正输出层的加权系数 ;
(7) 由式(12),计算修正隐含层的加权系数 ;
(8) 置 ,返回到(2)。
2 温度控制系统设计
本文中的温控对象是一套四温区的加热实验装置,其温控系统硬件的构成如图3所示。每个温区都使用800W的加热棒加热,第一温区还有300W的干扰。温度经过铁板传导一定距离后到达温度传感器,不同的传导距离可以模拟不同的时滞和惯性。
该温度控制实验系统使用贝加莱(B&R)的硬件和软件平台来实现神经网络PID控制。
该实验系统主要硬件配置为:控制器和编程器采用Power Panel 200系列触控一体化HMI;采用数字输出模块(X20系列的DO6322) 对加热棒和干扰加热棒进行控制;采用热电偶模拟量输入模块(AT6402)进行温度采集。
图3 四温区加热实验温控系统的构成
控制器的数字量输出连接固态继电器,由固态继电器输出控制加热器的电压(软件编程中可使用PWM模式来控制输出)。
该系统的软件使用贝加莱的一体化编程平台Automation Studio,它是B&R公司自动化产品的一个通用编程环境,其内部自带的AR000是基于Windows-32的仿真器,可以通过TCP/IP协议的形式与Automation Studio进行通讯。AR000的使用主要是用于测试,其优势在于当对算法编程完成后,可用AR000模拟被控对象,对算法程序进行调试,避免了直接上机对被控对象进行调试时由于程序错误可能导致的损害。采用AR000仿真通过后,可直接将该实验硬件配置改为实际需求的硬件配置,而无需对程序重新编写。
3 仿真研究
一般工业上的温控对象均可近似为一阶惯性加滞后环节,假设被控对象的模型为
设 ,BP神经网络的结构为 ,学习速率 和惯性系数 ,采样时间为1s,初值权值取区间 上的随机值,运行稳定后用稳定值代替随机值,其设定温度值改变和加入干扰后的AR000仿真曲线见图4。
图4 设定温度值改变和加入干扰后的温度曲线
由图4可以看出,初始设定温度是 ,系统输出温度在第一次到达稳定区域时有超调,稳态误差为 ,接着改变设定温度为 ,系统输出实际温度几乎无超调,然后系统加入10%的干扰,系统输出温度值也能很快回归到稳定区域。由图4可知,不论是设定温度值发生改变还是系统加入干扰,控制器都能实现控制器参数的实时在线整定,从而使得输出温度值 仍能很好地跟踪设定温度值 ,具有很好的鲁棒性和抗干扰性。
4 实验
采用温度控制系统进行实验,BP神经网络的结构为 ,学习速率 和惯性系数 ,初值权值取区间 上的随机值,运行稳定后用稳定值代替随机值,采样时间是10s,其温度设定值改变和加入干扰的实验曲线如图5。
图5 设定值改变和加入干扰的温度曲线
由图5可以看出,系统输出温度在神经网络PID控制器的控制下最终到达稳定状态,温度稳态误差是 ,系统有超调。其中稳定后控制器的权值取值为:( 为所有隐含层加权系数 组成的矩阵, 为所有输出层加权系数 组成的矩阵)
(14)
(15)
当温度设定值从 变化到 时,系统调节时间小,并且几乎无超调,超调很小,稳态误差是 。其中稳定后的权值取值为:
(16)
(17)
当系统加入PWM=10%的干扰,系统输出温度值也能很快地回归到稳定状态。其中稳定后的权值取值为:
(18)
从式(14)~式(17)可以看出,当设定温度发生改变时,控制器通过神经网络的自身学习、加权系数的调整来实现PID参数 , , 的实时在线整定,从而使得输出温度值 可以在各个温度下很好的跟踪给定温度值 。从式(16)~式(19)可以看出,神经网络PID控制算法在加入干扰时能将外界干扰转化为模型本身的变化,从而达到抑制干扰的目的。从图5可以看出,基于BP网络的PID控制能保证温控系统实现一定精度的动态跟踪,轨迹跟踪误差是 。但是系统第一次到达稳态所用的时间较长,并且有超调,这是由于控制器的初始权值是随机值,控制输出在开始时波动很大,随着网络的学习不断调整权值使输出能跟踪输入,收敛速度慢,因此到达稳态所用的时间较长。 理论上神经网络的输出可以达到所需要的任意精度,其精度控制内嵌于神经网络控制环中,可以确定输出误差的任意小量,但在实际中要兼顾精度和实时性的要求。
5 结束语
将基于BP网络的PID控制器用于温度控制系统中,目的就是为了更好地使系统输出温度值能够更密切地跟踪设定温度值,实现对被控对象的精确控制。仿真和实验结果均证明了神经网络PID控制算法能有效地控制大时滞大惯性的温控系统,将神经网络与PID控制相结合,可以在线调整PID控制器的各个参数,减少了凭经验整定参数带来的误差,提高了温控系统的鲁棒性和自适应性。此外,神经网络PID控制器还能有效的抑制干扰,而且对对象模型要求不高,具有较好的抗干扰性。同时也可以进一步优化BP神经网络的结构和算法,使温度控制最终趋于最优,更好地满足实际生产对温度控制的要求。但是由于该控制器的初始权值是随机值,控制输出在开始时波动很大,随着网络的自学习,不断调整权值控制输出来跟踪输入。由于神经网络收敛速度慢,回到稳定状态所需时间较长,这个问题有待进一步研究解决。
参考文献
[1] 陶永华. 新型PID控制及其应用(第二版)[M]. 北京:机械工业出版社,2002.
[2] 郑君里,杨行. 人工神经网络 [M]. 北京:高等教育出版社,1992.
[3] 刘国东,丁晶. BP网络用于人文预测的几个问题探讨[J]. 水利学报,1999-1:65-69.
[4] 赵斌. BP模型在大坝安全监测预报中的应用[J]. 大坝观测与土工测试. 1999-12:1-3.
[5] 张文鸽,吴泽宁等. BP神经网络的改进及应用 [J]. 河南科学,2003-4:202-206.
作者简介
徐利云 女,1985年生,山东大学控制科学与工程学院在读研究生,主要研究方向为智能控制与优化方法。
贝加莱(B&R)工业自动化是一家全球性自动化领导厂商,专业致力于创新自动化前沿技术,总部位于奥地利,目前已在全球60个国家设立了分支机构,拥有155个办事处。“完美自动化”与“您的全球自动化合作伙伴”是贝加莱工业自动化的使命与追求。
1996年8月,贝加莱工业自动化(上海)有限公司正式落户中国上海,本地化的销售与精湛的技术队伍为中国客户带来更迅捷的服务响应。十几年来,贝加莱(中国)一直专注于为国内用户提供高品质的自动化全线产品和优秀的技术解决方案。现在,贝加莱的产品和方案已广泛应用于机械自动化领域,如包装、印刷、塑料、纺织、食品饮料、机床、半导体、制药等行业;以及过程自动化领域,如电力、冶金、市政、交通、石油、化工和水泥等行业。目前,贝加莱产品已通过ISO 9001、UL、TÜV、GOST-R等国际认证,产品质量、性能等受到了用户的普遍赞誉,赢得了信誉。如今,贝加莱(中国)已成立了北京、广州、济南、西安、成都和沈阳办事处,上海及各办事处建立了完备的技术培训中心,以及分布在全国的大学联合实验室。 |