1 引言
在调节控制器时,首先要由系统输出反向传递到系统可控输入,才能运用一般的参数调节方法,但未知系统特性不可能事先精确预知,所以自适应控制理论在这个方向进展遇到障碍。而神经网络具有高度非线性映射能力和强大的学习适应能力以及特殊的分层结构,它与直接自适应控制方法的相结合可使问题得到解决。
近年来,神经网络的稳定性获得广泛的关注[1],对于未知非线性系统,以神经网络为基础的控制技术已被认为是非常有实际意义。许多神经网络自适应控制中的研究已经运用在不确定非线性连续系统[2-4]。然而,由于在离散系统中存在一些困难,例如在反推设计的非因果的问题,在离散邻域的工作远少于连续邻域[5-7]。对于一类严格反馈系统来说,已经提出用离散系统的自适应反推算法解决上述问题。随后,基于神经网络和模糊逻辑系统的带有未知函数的非线性离散系统在自适应控制器设计上取得了一些显著的进展。但这些方法的主要缺点是[8],有太多的自适应参数需要进行调整,从而高阶系统中的学习时间往往是令人无法接受,并且控制器落实不可避免的要消耗大量时间。本文利用反推控制技术和神经网络逼近性原理设计了一类离散非线性系统的自适应控制器,提出的控制方法只需考虑较少的自适应参数,减少了计算量,最后的仿真结果说明了本文方法的有效性。
2 系统描述和观测器设计
2.1 非线性系统描述
非严格反馈离散非线性系统描述为:

其中:
是状态向量,
是控制输入,
是系统输出,状态向量
是不可测的,
是未知的有界扰动,即:
。
本系统描述为一类非严格的离散非线性系统,可以采用一个一步神经网络观测器。
假定1.期望的归迹
是有界的,并且它未来的值是可用的。
假定2. 未知光滑的函数
是有界的,并且满足条件
。
控制目标是使系统输出
跟踪到期望的归迹
。由于把
考虑为不可用的状态,两个状态
可通过观测器进行估算。而后,这个估算的状态被用于设计自适应NN输出反馈控制器。
2.2 观测器的构建
考虑上述系统,为了简便,我们定义
为
,
为
,其中
和
是未知光滑的向量函数。系统可重写为:


其中:

因为
是不可测的,可设计一个观测器用来输入过去的值对状态向量进行估算。换而言之,要求一个观测器通过
和
能观测到
的估计状态。因为控制输入
是可用的,然而
是未知的,它能通过神经网络逼近。因此
能通过过去的值被估算出来,控制输入通过用一个动态映射用神经网络逼近。
可做为一个未知的光滑向量函数,它能通过NN进行逼近

其中:1
,矩阵
和
代表目标输出和隐藏层的权重,隐藏层函数
是隐藏层节点数,
是函数逼近误差。(3)式表明:如果隐藏层权重
在初始随机选择时保持不变,并且隐藏层节点数是充分大的,这个逼近误差
能够任意小。
定义观测器:

其中
估值,
是观测器的输入,矩阵
是实际输出层重。
观测权重调节为:

其中:
是设计参数。
3 自适应NN输出反馈控制
3.1 Backstepping控制器设计
定义实际和期望归迹间的跟踪误差为:

其中:
是期望归迹。
结合式(2)与式(7),可写为:
(8)
通过观察
作为一个虚拟的控制输入,期望的反馈控制可设计为:
与
均为未知光滑的向量函数,期望的反馈控制
并不能在实际中应用。

是一个
和
的光滑函数。
能通过神经网络进行逼近:

其中:
NN输入是
,
是理想的输出或隐藏层权重,
是隐藏层节点数。为了方便,我们把
简记为
为逼近误差。
假定在紧集
中,
满足

其中:
是未知常数,范数
定义为2范数,
被定义为
,让
。
因为
是不可用的,我们将用状态的估计做为NN输入,对它时行替换。随后,建立虚拟的控制输入

其中:
。
自适应律为:

可测的状态作为NN输入没有改变。下面定义权重估计误差为:

定义
和
之间的误差为:

通过式(8)与式(15)可得

其中:

由式(15)可得

利用这些作为输入,单层动态神经网络能用于预测
领先一步。通过用以上提及的输入,前馈神经网络构架的第一层产生
,而这又是第二层用于创建合适的控制输入。在另一方面,我们能用一个单层的动态神经网络得到
,而反过来又用来作为对第三控制NN输入创建一个合适的控制输入。这里,两个单层的神经网络结合成为一个多层的神经网络。
下一步通过用第二个NN选择理想的控制输入

其中:
是理想的输出或隐藏层权重,
是隐藏层节点数。通过Lyapunov函数确保稳定性,
是NN输入。因为运用了单一的NN,我们避免了控制器奇异问题。
自适应律选择为:

3.2 自适应律设计
假定
是观测器和两个神经网络的未知输出层目标权重,并且假定他们是有界的
其中:
表示未知目标权重的界,范数是Frobenius范数。
假定逼近误差
在紧集中是有界的,他们的上界分别是
。
考虑到系统能满足上述假定。让未知扰动有界
。让NN观测器、虚拟控制输入和实际控制输入分别由式(5)、(12)和(19)所定义。通过选择合适的设计参数,估计误差
,跟踪误差
是UUB,选择下面的设计参数
(21)
证明:选择Lyapunov 函数为:

通过一次差分计算
可得
第一项
利用式(5)和柯西不等式可得:


由式(19)可得
(29)
结合式(24)-(29)可得:

因此只需式(21)满足

根据李亚谱诺夫扩展理论,证明了
,
,权重估计误差,和是有界的。
4 仿真
为了证明这种方法的有效性,考虑如下非线性系统:

其中:
是状态向量,
是控制输入,
是系统输出。
跟踪目标是让输出
跟踪到期望的参考信号
,
其中:
,间距
。
构造自适应NN控制器为:
(33)
选择下列自适应律
(34)
其中:

建议观测器

选择自适应
(36)
其中:
图1-3给出仿真的结果。图1显示了系统输出
和参考信号
的归迹。获得良好的跟踪效果。图2显示了观测器误差归迹的跟踪效果。得到观测器的设计对于不可测的状态是有效的。图3给出了控制器
的有界性。

5 结束语
利用反推技术和神经网络的逼近性,我们提出了一种二阶离散非线性系统的非严格反馈形式自适应输出反馈控制方法。并证明了该闭环系统的有界性(UUB)。通过仅调整未知界的估计(只需考虑少量的自适应参数),提出的这种控制方法减少了计算量。结果表明,该控制器的表现非常良好,同时满足闭环系统的稳定性。该方法能很容易地扩展到n阶系统。
参考文献:
[1] WANG Z S,ZHANG H G.Global asymptotic stability of reaction杁iffusion cohen杇rossberg neural networks with continuously distributed delays[J].IEEE Transactions on Neural Networks, 2010,21(1):39-49.
[2] Ge S S and WANG C.Adaptive neural control of uncertain MIMO nonlinear systems[J].IEEE Trans.neural
[J].International Journal of Systems Sciences,2010,40(2):143-158.
[5] YEH P C and KOKOTOVIC P V. Adaptive control of a class of nonlinear discretetime systems[J]. International journal of control.1995,60(2):303-324.
[6] ZHANG Y,WEN C Y and SOH Y C.Robust adaptive control of nonlinear discrete-time systems by backstepping without overparameterization[J].Automatica,2001,37(4):551-558.
[7] VANCE J and JAGANNATHAN S.Discrete-tim neural network output feedback control of nonlinear discrete-time systems in non-strict form[J].Automtica,2008,l44(4):1020-1027.
[8] ZHU Q M and GUO L Z.Stable adaptive neurocontrol for nonlinear discrete-time systems[J].IEEE Transactions on neural networks,2004,15(3):653-662.
作者简介:段玉波(1951-),男,教授,主要从事智能控制,最优滤波,神经网络及应用等方面的理论与研究。