【信息科学与控制工程】
在实际工程系统中,系统参数值往往受到系统内部模型的改变以及外界不确定干扰的存在而产生变化,这种不受控的参数值的改变会破坏系统的稳定性。如文献[1]中电机负载的改变会使系统的参数产生漂移。目前非线性系统的参数漂移的研究成果较少,因此本文针对非线性系统的参数漂移问题做进一步的研究。
非线性纯反馈系统[2-3]是更普遍的系统,其控制输入和状态变量都具有非仿射结构,因此非线性纯反馈系统更能反映实际工程系统的情况。RBF神经网络模拟人脑的局部神经网络结构,已证明RBF神经网络能以任意精度逼近任何连续函数[4-6]。近年来,针对RBF神经网络自适应的控制研究引起了学者的广泛关注,且在文献[7-9]中给出了基于Lyapunov方法的神经网络控制系统稳定性分析方法。在很多文献中都要求系统模型是已知[10-12],然而在许多实际工程系统中,系统的精确模型不能被提前获取,并且由于外界干扰的存在,系统的精确模型更难被准确测量,于是我们引入了RBF神经网络来对系统有关未知模型逼近,以解决未知系统模型的问题。
对于系统参数的不确定性,当存在外界干扰或者未建模动态时,会出现参数漂移,这种情况下无法保证参数的估计值有界,从而使得闭环系统中的其他信号发散,进而控制器会使系统的稳定性恶化。处理这种情况常用的方法是在参数自适应律中增加鲁棒项或投影算子,然而这种投影算子方法的参数自适应律是不连续的,也不能直接应用于反步法。因此,文献[13]提出了一种充分光滑投影算法。本文采用充分光滑投影算法来消除参数漂移对系统稳定性的影响,此外本文设计出新的系统参数模型以符合实际工程系统的要求。在文献[10]中参数模型为其中每一个子系统的参数都要求相同,而本文所设计的参数模型为其中hi是任意正常数,这改进后的参数模型更加灵活,更符合实际系统要求。
非线性纯反馈系统是更加普遍的非线性系统,其状态变量和控制输入存在的非仿射结构,这就意味着系统状态和输入之间存在强耦合,因此很难找到稳定的控制器。我们考虑如下的非线性纯反馈系统:
(1)
式(1)中:(x1,x2,…,xn)∈Rn为系统(1)的状态量,为控制输入量;是关于xi+1的未知光滑非仿射性函数;是带有控制输入的未知光滑非仿射性函数; y∈R为系统的输出;是已知的光滑函数, φi(0,…,0)=0; Ξi=[Ξ1,…,Ξhi]T表示未知参数向量,为未建模动态、外界干扰等非线性项。
式(1)比传统非线性纯反馈[2-3]增加了未知参数项,其中Ξi可表示为具有任意维度的未知向量,即hi可为任意正常数。
引入中值定理[14],系统(1)可以被写成:
(2)
式(2)中,giμi是未知的非线性光滑函数,满足xμi=μixi+1+(1-μi)xi0,0<μi<1,xi0是给定时间t0下的已知量,为了方便计算,令xi0为0。
从系统(2)可以看出,中值定理分离了系统(1)中fi(·)的非仿射结构。
假设1[15] 存在一个已知的正常数b和c,使得未知的非线性光滑函数gi(·)满足成立,不失一般性,我们假设0<b≤gi(·),i=1,…,n。
假设2 参考信号yd是光滑连续且n阶可导的有界函数。
假设3 对于未建模动态、外界干扰等非线性项存在正常数满足
假设4 未知参数是有界的,存在一个有界集Ω,满足
Ω={Ξ∶||Ξ||≤Ξ0}
(3)
式(3)中, Ξ0是已知的正常数。
(4)
式(4)中符号信息定义如下:
其中σ>0和δ>0为任意正常数。
如果该算法具有以下性质:
是m阶可微的。
RBF神经网络对未知函数具有良好的逼近能力,其广泛应用在控制理论、图像处理和人工智能领域中。
RBF神经网络的数学表达式为:
φ=WTS(Z)
(5)
其中,W=[w1,w2,…,wl]T∈Rl表示神经网络的权重向量,l>1是神经网络的节点数;Z∈ΩZ⊂Rq是神经网络的输入向量,q是神经网络的输入维度;S(Z)=[s1(Z),s2(Z),…,sl(Z)]T∈Rl是基向量函数,si(Z)是第i个节点的输出。通常选择的基函数si(Z)为下面的高斯基函数:
其中,r是高斯基函数的宽度,ξi=[ξi1,ξi2,…,ξiq]T是高斯基函数的中心。RBF神经网络能以任意精度ε逼近紧集ΩZ∈Rq上的任何连续函数φ(Z)为:
(6)
式(6)中,ε(Z)是逼近误差且满足|ε(Z)|≤τ。对于所有的Z∈ΩZ,W*的值就是使得逼近误差ε(Z)最小的W值,其定义为:
在本文中,令其中是未知常数θi的估计,其中bi与假设1有关。
在本节中,反步法被呈现。反步法包含n步。在第i步(i=2,…,n-1),设计出虚拟控制器和自适应律,由RBF神经网络逼近有关未知函数项。在第n步,给出实际控制器。
本文使用如下RBF神经网络表达式来逼近未知函数为:
(7)
根据 Young’s不等式,式(7)可获得以下不等式:
(8)
(9)
式(8)~(9)中:和是RBF神经网络的是输入向量;ηi是正的设计参数。
步骤1 根据z1=x1-yd和系统(2),我们有
(10)
构造如下的Lyapunov函数为:
(11)
式(11)中,γ和ξ是正的设计参数。
V1关于时间求导得:
(12)
虚拟控制器设计为:
(13)
式(13)中,k11和k12是正的设计参数。
把式(13)代入式(12)得到:
(14)
式(14)中,使用RBF神经网络式(7)去逼近以及引入不等式(8)和(9),则式(14)可以写成:
(15)
式(15)中, μ1=φ1z1和
RBF神经网络自适应律和参数自适应律设计为:
(16)
(17)
根据充分光滑投影算法的性质2,把式(16)和式(17)代入式(15)可得:
(18)
式(18)中,
步骤i 根据zi=xi-αi-1,我们有
(19)
式(19)中,
构造如下的Lyapunov函数:
(20)
Vi关于时间求导可得:
(21)
虚拟控制器设计为:
(22)
其中,ki1和ki2是正的设计参数。
把式(22)代入式(21)得到:
(23)
其中,使用RBF神经网络式(7)去逼近以及引入不等式(8)和(9),则式(23)可以写成:
(24)
式(24)中,
RBF神经网络自适应律和参数自适应律设计为:
(25)
(26)
根据充分光滑投影算法的性质2,把式(25)和式(26)代入式(24)可得:
(27)
式(27)中,
步骤n 根据zn=xn-αn-1,我们有
(28)
其中,
构造如下的Lyapunov函数:
(29)
Vn关于时间求导得
(30)
实际控制器设计为
(31)
式(31)中,kn1和kn2是正得设计参数。
把式(31)代入式(30)得到
(32)
其中,使用RBF神经网络式(7)去逼近以及引入不等式(8)和(9),则式(32)可以写成
(33)
式(33)中,
RBF神经网络自适应律和参数自适应律设计为
(34)
(35)
根据充分光滑投影算法的性质2,把式(34)和式(35)代入式(33)可得
(36)
式中,
令Vn=V,k=min{b1k11,…,bnkn1}和则式(36)重写为
(37)
在t∈[0,T],对式(37)积分可得
(38)
以及考虑到V(T)≥0,我们有
(39)
因此,得出以下定理。
定理1 对于系统(1),如果系统满足假设1~4,且采用虚拟控制器(22)、实际控制器(31)、RBF神经网络自适应律(25)和参数自适应律(26),则跟踪误差是一致最终有界的,闭环系统是稳定的。
在本节中,采用2个仿真实验来证实所设计控制方法的正确性。
例1 数值仿真。
考虑如下的二阶非线性纯反馈系统:
(40)
对系统干扰项为跟踪目标为yd=0.5sin(πt)。
系统设计参数设计为:k11=2.2,k12=20,k21=1,k22=20,Ξ0=0.1,σ=0.1,δ=0.1,η1= η2=0.5,γ=5,ψ1=ψ2=0.1,ξ=0.1;系统初始化设计为:参数真实值为:Ξ1=[0.2sin(t),0.2]和Ξ2=[0.1sin(t),0.1]。选择少量的高斯基函数节点数,RBF神经网络宽度设置为4,W1S1(Z1)包含6个节点,W2S2(Z2)包含11节点,高斯基函数中心设置为:
其中i表示节点数。
图1表示系统输出信号y的跟踪轨迹和参考信号轨迹yd;图2表示系统的状态变量轨迹;图3表示系统的输入信号u(t);图4是未知参数Ξ1的估计曲线;图5是未知参数Ξ2的估计曲线;图6为RBF神经网络自适应律的曲线;图7是本文所设计控制器的跟踪误差与文献[12]中跟踪误差曲线,从图7可以看出,本文的跟踪性能更加优越。
图1 跟踪性能轨迹
图2 系统状态变量轨迹
图3 系统的实际控制律u(t)曲线
图4 参数Ξ1的估计曲线
图5 参数Ξ2的估计曲线
图6 RBF神经网络自适应律和曲线
图7 跟踪误差曲线
例2 物理仿真。
考虑如下的机电系统[16]:
(41)
式(41)中:e21=1/M, e22=-N/M, e23=-B/M, e31=1/L, e32=-KB/L, e33=-R/L是系统设计参数; 和是未知的光滑函数;是已知的状态变量;参数M、N、L、B、KB、R的描述来源于文献[1]。
从上述机电系统看出,设计参数e21、e22、e23与电机的负载有关,随着负载的变化设计参数会产生变化,因此我们采用光滑投影算子来消除这种参数变化,由RBF神经网络来逼近未知函数和是跟踪信号。系统设计参数设计为:k11=5,k21=5,k22=20,k31=5,k32=20,其余参数和例1相同;系统初始化设计为:
图8表示系统输出信号y的跟踪轨迹和参考信号轨迹yd;图9表示系统的状态变量轨迹;图10表示系统的控制输入信号u(t);图11是未知参数e21、e22、e23的自适应律曲线;图12表示本文所设计的控制器的跟踪误差。
图8 跟踪性能轨迹
图9 系统状态变量轨迹
图10 系统的实际控制律u(t)曲线
图11 未知参数e21、e22、e23的自适应律曲线
图12 跟踪误差曲线
本文研究了具有未知参数的一类非线性纯反馈系统的神经网络自适应跟踪问题。结合充分光滑投影算法和RBF神经网络设计出新颖的虚拟控制器、实际控制器以及自适应律,解决了未知非线性纯反馈系统中未知参数漂移的问题,设计的控制器能够使闭环系统的跟踪误差收敛到原点的一个小邻域内。最后的仿真研究进一步证明本文设计方法的正确性。
[1] DAWSON D M,CARROLL J J.Integrator backstepping control of a brush DC motor turning a robotic load[J].IEEE Transactions on Control Systems Technology,1994,2(03):233-244.
[2] HE C,WU J,DAI J Y,et al.Approximation-Based Fixed-Time Adaptive Tracking Control fora Class of Uncertain Nonlinear Pure-Feedback Systems[J].Complexity,2020(08):1-17.
[3] 左仁伟,董新民,刘棕成.纯反馈非线性系统的鲁棒自适应跟踪控制[J].电光与控制,2018,25(10):17-23.
[4] 佟廷帅,刘晓利,张志勇,等.基于RBF神经网络增益调节的滑模制导律[J].兵器装备工程学报,2019(12):110-114.
[5] 唐逸雄,陈龙淼,高波.链式回转弹仓的RBF神经网络滑模控制[J].兵器装备工程学报,2018,39(11):141-145..
[6] POGGIO T,GIROSI F.Networks for approximation and learning[J].Proceedings of the IEEE,1990,78(09):1481-1497.
[7] ZHANG T,GE S S.Adaptive Neural Network Tracking Control of MIMO Nonlinear Systems with Unknown Dead Zones and Control Directions[J].IEEE Trans Neural Netw,2009,20(03):483-497.
[8] YU S,ANNASWAMY A M.Adaptive control of nonlinear dynamic systems using θ-adaptive neural networks[J].Automatica,1997,33(11):1975-1995.
[9] SSU-HSIN Y U,ANNASWAMY A M.Stable Neural Controllers for Nonlinear Dynamic Systems[J].Automatica,1998,34(05):641-650.
[10] JIA F J,YAN X,WANG X H,et al.Robust adaptive prescribed performance dynamic surface control for uncertain nonlinear pure-feedback systems[J].Journal of the Franklin Institute-Engineering and Applied Mathematics,2020,357(05):2752-2772.
[11] 蒋沅,贾付金,代冀阳.一类非线性纯反馈系统的预定性能控制器设计[J].控制与决策,2018,33(09):1719-1724.
[12] HE C,WU J,YING J,et al.Adaptive Dynamic Surface Control for a Class of Nonlinear Pure-Feedback Systems with Parameter Drift[J].Mathematical Problems in Engineering,2020(06):1-11.
[13] CAI Z,DE Q M,DAWSON D.A sufficiently smooth projection operator[J].IEEE Trans.On Automatic Control,2006,51(01):135-139.
[14] APOSTOL T M.Mathematical Analysis[M].Reading,MA:Addison-Wesley,1963.
[15] WANG M,GE S S,HONG K S.Approximation-Based Adaptive Tracking Control of Pure-Feedback Nonlinear Systems with Multiple Unknown Time-Varying Delays[J].IEEE Trans Neural Netw,2010,21(11):1804-1816.
[16] SUN Y,CHEN B,LIN C,et al.Finite-Time Adaptive Control for a Class of Nonlinear Systems With Nonstrict Feedback Structure[J].IEEE Transactions on Cybernetics,2018,48(10):2774-2782.
Citation format:HE Cheng, WU Jian, ZHANG Zhe.Neural Network Tracking Control of Nonlinear Systems to Suppress Parameter Drift[J].Journal of Ordnance Equipment Engineering,2021,42(06):183-189.