多智能体弱刚性编队控制器设计

杨秀霞,严 瑄,张 毅

(海军航空大学, 山东 烟台 264001)

摘要:研究了双积分模型的多智体弱刚性编队控制问题,给出了基于距离的多智能体弱刚性编队的双积分模型,设计了弱刚性编队控制律。将多智能体系统运动学描述为一个哈密顿系统。然后,基于哈密顿系统和梯度系统的等价性分析该控制系统的稳定性。仿真结果表明,所设计的控制器能够有效生成弱刚性编队。

关键词:多智能体编队;刚性编队;弱刚性编队;梯度控制;编队控制

1 引言

编队控制是多智能体系统领域中研究最为广泛的问题之一,其主要目的是驱动智能体使得系统达到期望的状态。根据智能体的感知能力和拓扑结构,编队控制可以分为基于位置的控制、基于位移的控制以及基于距离的控制[1-2]

在基于距离的编队控制中,所有智能体不需要任何全局坐标信息或任何坐标系对准来实现所提出的控制。只需要通过智能体间的距离来确定所需的编队队形,这就要求多个智能体之间的连接必须是刚性的[3-5]。在文献[6]中,给出了基于梯度的控制策略,以实现刚性编队的形成。在文献[7]中,提出了一种基于Henneberg顶点加法的控制策略,以实现最小刚性编队的形成。然而,队形刚性需要知道大量的距离约束,在实际应用中,这种要求并不容易得到满足。为了减弱刚性的条件,文献[8]提出了一种新的刚性概念——弱刚性。弱刚性编队除了考虑距离约束之外,还引入了一些角度约束。因此,即使从刚性的观点来看编队是非刚性的,该编队也可以进行刚性变换。弱刚性是用来判断附加角度约束的非刚性编队能否保持其队形(刚性)。文献[9]把成对的、相对位移的内积约束替换成角度约束,可以更加方便地描述编队的弱刚性。并且提出了基于梯度的控制律,用于生成无穷小弱刚性编队。该控制律针对的是一组单积分模型的智能体,没有考虑系统中智能体的速度等状态量。文献[10]引入了二维空间中框架弱刚度矩阵和无穷小弱刚性的新概念,用弱刚度矩阵直接检验框架是否为无穷小弱刚性。并将这些新概念应用于一个具有梯度控制律的三智能体编队控制问题。文献[11]提出了广义刚性和广义无穷小刚性的概念,这些概念适用于二维和三维空间。将广义无穷小刚性应用于二维和三维空间中含有n个智能体的编队控制问题,证明了广义无穷小刚性编队局部渐近收敛到期望的队形。文献[9-11]只是研究了无穷小弱刚性编队的控制问题,并没有考虑一般情况下弱刚性编队的控制问题。

本文设计了一种弱刚性编队控制器,适用于所有的弱刚性编队(包括无穷小弱刚性编队)。所提控制器能够在维持编队结构稳定的同时,最大限度地减少编队内部的信息交互量,降低通信复杂度,减少通信能量消耗;同时本文被控对象的系统动力学模型是二阶系统,实际应用范围更加广泛。

2 问题描述

2.1 刚性理论

n个顶点和m条边的无向图可以表示为G=(V,E),其中V={1,2,…,n}和EV×V 分别表示顶点集合和边的集合。本文考虑的图均是无向图,即边(i, j) 和边(j,i)是一样的。关联矩阵H=[hij]∈Rn×m的行和列分别对应图G的顶点和边。为了方便研究,本文引入有向图的关联矩阵H。 在关联矩阵H中,边(i, j)∈E对应的列第i行为1 、第j行为-1,其余位置元素均为0。

d维空间中,通过分配每个顶点一个坐标piRd,iV,图G可以用来描述多智能体编队。刚性理论研究图G(多智能体编队)是否能进行刚性变换(平移、旋转、反射)。

矢量表示图G的实现或配置。(G,p)表示一个框架,关于这eij=pi-pj个框架的刚度函数定义为:

gG(p)=(…,,…)T, (i, j)∈E

(1)

式(1)中,||eij||表示顶点i和顶点j之间的欧式距离。刚度函数gG(p)是认识框架(G,p)的关键。

2.2 弱刚性理论

首先例举一个简单的例子,如图1所示。图1(a)是最小刚性框架,去掉边(2,3)将会变成非刚性框架,如图1(b)所示。由于因此||e23|| 可以通过||e12||,||e13||获得,其中可以看作对角度α的约束。综上可知,通过图1(b)几何形状仍然可以唯一确定(任意顶点之间有恒定的距离)。根据上述结论来引入一个广义的刚性(弱刚性)。

图1 2种不同类型的框架示意图

Fig.1 Two different types of frameworks

首先修改刚度函数,通过使用修改的刚度函数来描述弱刚性图。定义集合表示ΤG的一个子集,s表示集合中元素的个数。将视为修改刚度函数的一个分量,修改的刚度函数rG(p)为:

(2)

综上可知,刚性图G=(V,E)通过集合ΤG可以得到弱刚性图Gw=(V,Ew)。对比刚性理论和弱刚性理论可知,刚性图G=(V,E)通过不同的集合可以变为不同的弱刚性图,因此基于距离的刚性编队控制问题可以转变为对弱刚性编队的控制问题。

2.3 模型建立

d维空间中考虑n个双积器模型的智能体为:

(3)

式(3)中:piRd表示全局坐标系∑g中智能体i的位置; viRd表示全局坐标系∑g中智能体i的速度;uiRd表示全局坐标系∑g中设计的加速度输入。

假设每个智能体的方位不需要与全局坐标系保持一致,则∑local(i)表示智能体i的局部坐标系。通过采用上标表示坐标系,智能体的双积器模型可被写为:

(4)

式(4)中:表示局部坐标系∑local(i)中智能体i的位置;表示局部坐标系∑local(i)中智能体i的速度;uiRd表示局部坐标系∑local(i)中设计的加速度输入。

系统中智能体间的通信拓扑用无向图G=(V,E)来表示。假设每个智能体以自己的局部坐标系为基准,测量其邻近智能体的相对位置,以下测量可通过智能体iV得到:

(5)

式(5)中,表示在局部坐标系∑local(i)中智能体j的位置。

对于期望队形期望的平衡可以被描述为集合Ep*,v*,即:

Ep*,v*={[pT,vT]TR2nd:(pj-pi)T(pk-pi)=

(6)

式(6)中:

下面对双积器模型智能体的队形形成控制问题陈述如下:

d维空间中n个双积器智能体,假设智能体之间的通信拓扑由刚性图G=(V,E)通过集合生成的弱刚性图Gw=(V,Ew)给出。给定一个实现p*Rnd,在测量(5)的基础上设计分布式控制律,使得系统在该分布式控制律的作用下集合Ep*,v*渐近稳定。

3 控制器设计

3.1 编队控制律设计

由于编队的通信拓扑是由弱刚性图Gw=(V,Ew)给出,编队控制律需要考虑成对的相对位移的内积约束,因此刚性编队的梯度控制律无法直接应用到弱刚性编队中,本文设计了一个类梯度控制律。

定义一个局部类梯度函数:

(7)

式(7)中:kp>0;kv>0;γ是满足假设2.1的函数。

假设3.1函数 γRR+,满足下面2个条件。

1) 正定:γ(x)≥0,对∀xR当且仅当x=0时,γ(x)=0;

2) 解析:在0的邻域U0内,函数γ是解析的,基于函数ψi,智能体i的控制律可以被设计成:

(8)

(9)

(10)

式(9)中:

控制律(8)是分布式的,它可以在智能体的局部坐标系中使用测量(5)来实现。由于控制律(8)是在局部坐标系∑local(i)中实现的,因此需要通过合适的坐标变换到全局坐标系∑g中进行稳定性分析。表示在d维空间中从局部坐标系∑local(i)到全局坐标系∑g的线性变换。

(11)

(12)

(13)

(14)

根据式(11)、式(12)、式(13)和式(14),控制律(8)可以写成:

ui=

(15)

式(15)可以简写成式(16),即:

ui=-▽piψi(pi,…,pj,…,pk,…vi)-

kvviψi(pi,…,pj,…,pk,…vi)

(16)

3.2 稳定性分析

定义一个全局性类梯度的函数:

(17)

多智能体系统的运动学可被描述为一个哈密顿系统,即:

(18)

定义一个梯度系统:

(19)

定义集合集合为弱刚性图Gw=(V,Ew)的实现。

{pRnd∶(pj-pi)T(pk-pi)=

(20)

文献[12]的结果表明,梯度系统(19)和哈密顿系统(18)具有相同的平衡集Ep*,v*和局部稳定性。又由于梯度系统(19)的子系统是解耦的,因此可以通过研究梯度系统(19)的2个子系统的局部稳定性来研究梯度系统(19)的局部稳定性。子系统是全局稳定的,只要证明对于子系统集合是局部渐近稳定的,就能保证对于哈密顿系统(18)集合Ep*,v*是局部渐近稳定的。下面给出对于子系统集合是局部渐近稳定的证明。

定义一个全局性的梯度函数:

(21)

由于子系统可被描述为一个梯度系统,即:

(22)

集合的非紧性使得稳定性分析十分复杂。为了减少稳定性分析的复杂性,可以通过相对位移来描述动态系统。设可以得到集合在链接空间可以表示为:

(23)

只要保证集合是局部渐近稳定的就能保证集合是局部渐近稳定的。并且集合是紧集,相比于非紧集稳定性分析要简单很多。

(24)

由式(24)易知,ew属于HwIn的列空间,即ew∈lm(HwIn),lm(HwIn)表示弱刚性图Gw连接空间。定义则有

由文献[9]可知可以得到:

(25)

由式(25)可以推出:

(26)

式(26)中:

梯度系统(22)在连接空间可以表示为:

(27)

定义李雅谱诺夫函数:

(28)

(29)

由式(26)、式(27)和式(29),可知式(28)对时间求导可得:

(30)

因此,集合是局部渐近稳定的。要保证集合是局部渐近稳定的,需要找到集合的邻域使得

定义3.1 假设函数 fDRnfRzD的邻域内是解析的,则在z的某些邻域内存在常量kf>0 和ρf∈[0,1)使得式(31)成立。

||▽f(x)||≥kf

(31)

由定义3.1可以得到推论3.1。

推论3.1 存在一个邻域使得 有||▽φ(p)||>0。

证明:由于函数γ在邻域U0内是解析的,对存在邻域使得梯度函数φ在该邻域内是解析的。由定义3.1可知,对存在常量kφ>0 和ρφ∈[0,1)使得式(32)成立,即:

(32)

由函数γ的正定性可知,当且仅当φ(p)=0,因此对有||▽φ(p)||>0。

在推论3.1的基础上可以得到集合是局部渐近稳定的。

推论3.2 对于系统(22),集合是局部渐近稳定的。

证明:要使推论成立,只要证明对于系统(27),集合是局部渐近稳定的。令的邻域,取得到集合为:

(33)

定义集合的邻域

(34)

式(34)中,其中表示矩阵最小非零奇异值。由于集合是紧集,因此函数||ew-η||是关于η的连续函数。因此对存在使得式(35)成立。

(35)

因为所以存在pRnd使得可以得到:

(36)

(37)

根据式(37)得到又由推论3.1有,对存在的邻域有‖▽φ(p)‖>0。所以对有:

(38)

因此,对于系统(27),集合是局部渐近稳定的。对于系统(22),集合是局部渐近稳定的。

综上可知,对于哈密顿系统(18) 集合Ep*,v*是局部渐近稳定的。

4 仿真验证

在二维空间中,考虑一组6个智能体。定义γ函数为γ(x)=x2/2,假设期望的边长为智能体的初始位置为被均匀分布在[-7,7] m上的随机变量扰动后的位置。智能体的初始速度是由均匀分布在[-5,5] m/s上的随机变量随机给出。仿真结果如图2~图6所示,图2为采用文献[6]提出的算法得到的刚性编队队形;图3是在图2中刚性编队的基础上得到的弱刚性编队,最终形成弱刚性编队队形;图4为各边长渐近收敛到30。

图2 由文献[6]得到的刚性编队队形示意图

Fig.2 Rigid formation obtained by control strategy in paper[6]

图3 本文算法得到的弱刚性编队队形示意图

Fig.3 Weak rigid formation obtained by control strategy in this paper

图4 弱刚性编队中边渐近收敛到30

Fig.4 The side length error converges to 30 in the weak rigid formation

对比图2和图3,刚性编队需要的边数为9个,弱刚性编队只需要5个,本文设计的控制器需要知道更少的边来形成期望编队队形。图5和图6表明各智能体的速度趋近于0,有利于编队的队形保持。

图5 智能体x轴方向速度趋向于0

Fig.5 The velocity in the x direction of the agents converges to 0

图6 所有智能体y轴方向速度趋向于0

Fig.6 The velocity in the y direction of the agents converges to 0

5 结论

本文研究了二维空间弱刚性编队队形生成控制器,该控制器有效减少了编队中通信边的数量。将多智能体的运动学模型描述为一个哈密顿系统,利用哈密顿系统的性质简化了系统稳定性的分析。相比于生成刚性编队的控制器,本文所设计生成弱刚性编队的控制器需要更少的信息交互,而且不需要全局坐标信息或坐标系对准即可实现对编队的控制。另外,本文设计的控制器对所有弱刚性编队均可适用,提升了应用范围。

参考文献:

[1] 宋天华,王晓丽.多智能体系统编队控制研究综述[J].中国科技成果,2016,17(21):56-58.

Song Tianhua,Wang Xiaoli.Review of multi-agent formation control[J].China science and technology achivements.2016,17(21):56-58.

[2] OH K,PARK M,AHN H.A survey of multi-agent formation control[J].Automatica (Journal of IFAC),2015,53:424-440.

[3] KRICK L,BROUCKE M E,FRANCIS B A.Stabilization of infinitesimally rigid formations of multi-robot networks[C]//Proc.of the IEEE Conference on Decision & Control.IEEE,2009.

[4] DING G H,ZHU D Q.Control of leader-follower formation and obstacle avoidance for Multi-AUV[J].Chinese High Technology Letters,2014,24(05):538-544.

[5] SUN Z Y,HELMKE U,ANDERSON B D O. Rigid formation shape control in general dimensions:an invariance principle and open problems[C]//IEEE Conference on Decision & Control.IEEE,2015.

[6] OH K,ZHN H.Distance-based undirected formations of single‐integrator and double‐integrator modeled agents in n-dimensional space[J].International Journal of Robust & Nonlinear Control,2014,24(12):1809-1820.

[7] ASIMOW L,ROTH B.The rigidity of graphs[J].Transactions of the American Mathematical Society,1978,245:279-289.

[8] PARK M C,KIM H K,AHN H S.Rigidity of distance-based formations with additional subtended-angle constraints[C]//Proc.of the 2017 17th International Conference on Control,Automation and Systems (ICCAS),2017.

[9] JING G S,ZHANG G F,WING J L H,et al.Weak Rigidity Theory and its Application to Multi-agent Formation Stabilization[J].Siam Journal on Control & Optimization,2018,56(03):2248-2273.

[10] KWON S,TRINH M H,OH K,et al.Infinitesimal Weak Rigidity and Stability Analysis on Three-Agent Formations[C]//Proc.of the 57th Annual Conference of the Society of Instrument and Control Engineers of Japan (SICE),2018.

[11] KWON S,AHN H.Generalized Rigidity and Stability Analysis on Formation Control Systems with Multiple Agents[C]//Proc.of the 18th European Control Conference (ECC),2019:3952-3957.

[12] DORFLER F,BULLO F.Topological Equivalence of a Structure-Preserving Power Network Model and a Non-Uniform Kuramoto Model of Coupled Oscillators[C]//Proc.of the 50th IEEE Conference on Decision & Control & European Control Conference.IEEE,2011.

Design of Multi-Agent Weak Rigid Formation Controller

YANG Xiuxia,YAN Xuan,ZHANG Yi

(Naval Aviation University,Yantai 264001, China)

Abstract: In order to reduce the amount of internal information interaction and communication complexity of multi-agent formation control, a double integral model design method of weakly rigid formation controller is proposed.Firstly, the double integral model of multi-agent weakly rigid formation based on distance is established, and the target of weakly rigid formation control is given.Secondly, considering the inner product constraints of the paired relative displacements, a gradient-like formation control law is designed.Finally, the kinematics of the multi-agent system is described as a Hamiltonian system. Based on the equivalence between Hamiltonian system and gradient system, the stability of the system is analyzed.The effectiveness of the algorithm is verified by numerical examples.

Key words Multi agent formation; rigid formation; weak rigid formation; gradient control; formation control

收稿日期:2020-09-15;

修回日期:2020-10-13

基金项目:山东省自然科学基金项目(ZR2020MF090);总装预研基金项目(6142055040203)

作者简介:杨秀霞(1975—),女,博士,教授,E-mail:yangxiuxia@126.com。

通信作者:严瑄(1995—),男,硕士,E-mail:1652932574@qq.com。

doi: 10.11809/bqzbgcxb2021.07.036

本文引用格式:杨秀霞,严瑄,张毅.多智能体弱刚性编队控制器设计[J].兵器装备工程学报,2021,42(07):210-215.

Citation format:YANG Xiuxia,YAN Xuan,ZHANG Yi.Design of Multi-Agent Weak Rigid Formation Controller[J].Journal of Ordnance Equipment Engineering,2021,42(07):210-215.

中图分类号:TJ273

文献标识码:A

文章编号:2096-2304(2021)07-0210-06

科学编辑 张军 博士(江苏大学副教授)责任编辑 杨梅梅