TU2020

阅读笔记 Reset control for synchronization of multi-agent systems

摘要

提出一种基于reset control的design framework,既保证了asymptotic convergence又保证良好的transient response。这种control protocol由PI compensator和CI构成,在proportional term大于0时将integral term复位。最后举例说明,比较了本算法和traditional static/dynamic state feedback control and the quasi-reset control methods的差异。

 

 

结论

相比于只关注asymptotic behavior的传统方法而言,本文方法改善了multi-agent systems的transient performance。针对the consensus problem,设计一个 fully distributed and Zeno free reset control strategy仍待研究。

 

 

基本数学问题

理解图的拉普拉斯矩阵 - 知乎 (zhihu.com)

拉普拉斯矩阵实际代表了图的二阶导数,是对称半正定矩阵,具有n个非负特征值,其中必有一个特征值为0;特征值为0对应一个连通分量,其特征向量为对应连通顶点全1;(归一化矩阵不看)

伴读(序):多智能体系统协同控制 - 知乎 (zhihu.com)

如何理解几何重数和代数重数? - 知乎 (zhihu.com)

Regular system 正则系统    Regular linear system - Encyclopedia of Mathematics

 

 

文章讲的基本内容

文章讲的是一种基于复位控制的多智能体一致性算法,相比于静态/动态反馈和准复位算法其动态性能好。

这种算法的数学表示如下:

对于一个固定连通图,采用单积分器作反馈输入,即

定义其中的agent与邻居agent的状态差为

我们将引入Clegg积分器,其中Clegg积分器的方程特殊性表现在一旦,积分器会被复位,即

其中是积分项,也可以说是从上次复位开始到t时刻的积分器。

在初始条件下,我们可以把控制输入写成

结合上面写的,我们可以讲引入Clegg integrator的闭环系统写成

其中L是图的Laplace矩阵,这样子写的好处是可以直接把省略掉?-->这点可以从Laplace矩阵的导数性质感知到,这样整个系统变成一个线性定常系统。

可以知道的是这个A矩阵是一个的矩阵,它一定具有一个代数重数2、几何重数1的零特征值。

 

3.1给出了一个结论和证明:当的非零主导特征根(即)是复根,那么这个控制系统是正则的。

这里我不清楚正则具有什么特殊性质,只是文章说明了一个主要结论是只要满足即可。

 

3.2做的是Consensus analysis,其目的在于证明这个算法最终可以使每个agent至少经过一次复位都收敛到一致值。

 

3.3做的是Performance analysis,其目的在于分析算法性能,主要方法是比较复位控制和静态/动态控制的Lyapunov function值,看哪个衰减的比较快

 

最后提出算法可能存在Zeno现象,为了避免出现Zeno现象

的意思是一定要足够时间才能复位一次,加强了复位的条件,显然芝诺现象就不会发生了。

这种方法的缺点:however, requiring a centralized coordination of reset which is a drawback of this approach.(需要集中重置)

 

 

文章定理的主要证明思路

3.1    首先要证明的是系统的zero crossing不受的零特征值影响。这里运用到了Ren and

Beard (2008)的文章上面内容,把对角化后,非零特征值是一个Jordan块,

在状态转移阵中,利用J对应特征向量的性质,得到

此处从(特征向量性质)可以推出

然后是证明存在一个存在一个使得不是zero uniformly(一致趋于0,个人理解是不会在0附近单调而是震荡?)然后根据Bell et al. (2010) 给出的分解式,对任意大的时间,只有会在0附近震荡,说明了zero crossing的必然性。

然后分析每个原系统特征根的对应特征根应该有2n个特征根)的关系满足

可以使得的所有非零特征根全部为复数,保证了zero crossing。

 

3.2    这里要证明所有的agent都收敛到一致值,即证明微分方程

的稳定性,这里的目标是让所有的都趋于0。

构造一个Lyapunov函数

这个函数恒大于零,且当且仅当所有相等的时候为零,对Lyapunov函数求导

其中只有在对应agent属于最大的时候为1,其余为0,则相反。(Clarke, 1990)

那么就可以顺理成章地写成

(j表示属于最小集,p表示属于最大集)

如果,那么全部相等,自然,否则必然存在一个j和p使得,那么根据积分性质,从而,因此由LaSalle Invariance Principle (Cortés, 2006),所有收敛到一致值。

 

3.3 这个部分主要是做性能分析,和黄恩文章的主体内容分析有点类似

比较静态反馈系统和原闭环系统:

构造二次型Lyapunov函数比较二者衰减率

然后只要证明这一项是正的就行。

从符号角度而言,的积分项,二者同符号,可用一个时变函数(描述二者关系:

因此

所以复位控制的Lyapunov函数相比于静态反馈的下降率高,动态性能好,但是由于的时变性,其具体快了多少是较难分析的。

接下来就是比较动态反馈和复位控制,对于动态反馈而言

这个式子与复位控制的区别在于第二项不是基于上一次复位状态积分,而是基于零状态的累计值,因此无法保证的两项都是同号的,从文中表述即复位控制算法具有contraction property(收缩性?),此即(这个式子不知道啥意思)

 

Further discussions

为了防止出现Zeno现象的方法是使用集中重置(从上文给出,这也是方法的缺点);前面只证明了收敛到一致而不是均值,接下来需要证明的是能收敛到均值。

考虑均值,有

目标是证明这个恒为0,这个式子的第一项为0是显然的(从拉普拉斯转移阵的角度理解)。考虑一个复位的时刻到下一个复位前的区间和积分器的性质

这个式子第二项显然为0(复位后的积分状态是0)。对于而言,由于拉普拉斯矩阵每一行/列元素和为0,故,从而进而

考虑复位瞬间的状态变化

由3.1的结论可知

两边取范数

这里文章说Therefore, the average consensus is preserved by the fact that the state average is time-invariant.但是范数数学概念相关没太看懂。

 

 

总结

一周下来先是理了一些基本数学概念,整个文章大体上的理解和梳理就写在上面了,标红色的地方是不太理解的部分,理论方面一些线性代数和多智能体相关的知识和算法还需要补充一下,仿真的话这篇文章的控制算法不是很难,在基于最简单的静态反馈的代码(知乎那一篇伴读的分苹果代码)的基础上改一改应该是做得出来。.

分类:

技术点:

相关文章:

  • 2022-01-14
  • 2021-04-22
  • 2021-06-10
  • 2021-09-27
  • 2021-05-01
  • 2021-09-05
  • 2021-11-23
  • 2021-09-28
猜你喜欢
  • 2021-12-09
  • 2021-10-05
  • 2021-08-10
  • 2021-11-23
  • 2021-04-25
  • 2022-01-21
  • 2021-04-09
相关资源
相似解决方案