名词解释

多智能体系统中的一个基本问题就是一致性问题。一致性问题来源于多智能体系统的协调合作控制问题。一致性问题就是如何设计智能体局部之间的作用方式,使各智能体根据邻居传来的信息,不断调整自己的行为,使所有的智能体的状态随着时间的推移达到共同的值。设计智能体之间的通信方式,称作是一致性协议或者是一致性算法。聚类同步就是首先给多智能体系统分类,然后每个类中都实现一致性,即多一致性问题,本质上可化为一致性问题。

为什么说一致性问题是多智能体系统中的一个基本问题?例如,用一组机器人排成特定的队形,完成某个地域的地面扫雷工作,突然一个机器的零件更换导致不能运行,其他的几个机器人意识到这个突发状况,首先对这种情况达成共同的认识即一致性,然后才能做出决定,调整队形,继续完成扫雷任务。所以,一致性问题是多智能体系统协调合作控制问题的一个首要和基本的条件,是非常有必要进行研究的。

多智能体系统中的群集问题和编队控制中,只考虑位置靠拢和速度匹配问题,就是一致性问题。群集问题和编队问题最后都要化为多智能体系统的一致性的相关问题。因此,从另外一个角度说明了一致性问题是多智能体系统的协调合作控制的一个基本和首要问题。

一致性问题大量学者沿着不同思路和方法对多智能体系统一致性问题进行了研究,分别从连续和离散、固定和切换拓扑、带有时滞和无时滞、有领导者和无领导者等多个方面进行研究多智能体系统的一致性问题。

1.有领导者的多智能体系统的一致性问题在多智能体系统中,有个别智能体代表着整个多智能体系统的共同利益或者是其他智能体跟踪的目标,把这些智能体称作是领导者,把其他的智能体称作是跟随者,带有领导者的多智能体系统的一致性问题,也称作是一致性跟踪问题,就是通过合适的算法,使得领导者和跟随者的最终状态达到一致。这种方法有其缺陷,就是当领导者遭到破坏或者是领导者的速度变化过快导致跟随者跟踪不上时,领导者和跟随者的最终状态无法达到一致。

在研究带有领导者的一致性问题上,把领导者分为单个领导者和有多个领导者的情况。单个领导者的一致性问题方面,在现实的系统中,跟随者不能在线得到领导者的速度,这给设计一致性控制算法带来了困难,因此为了设计算法的需要,每个跟随者要估计领导者的速度。

单个领导者的一致性问题方面,在实际生活中,例如用一组自主的机器人去移除一些对人类有危害的物质( 例如一些放射性物质) ,为了保证这些装有有害物质的机器人按照预先指定的路线搬运到特定的地方,需要另外的一些机器人对它们进行约束,即这些机器人称为领导者,装有有害物质的机器人称为跟随者,要求设计合适的算法,使跟随者要在领导者形成的凸包里面,这就是多领导者的一致性问题,也称作是多智能体系统的包含控制问题1。

2.无领导者的多智能体系统一致性问题在多智能体系统中,如果各智能体的地位和作用是平等的,称这样的系统是无领导者的多智能体系统。无领导者的系统也可以看作是带有领导者的系统,即把其中一个智能体看作是虚拟的领导者就可以了。经典的一致性算法中,各个增益和每个边上的连接权重是确定的,这样带来了局限性。实际中,智能体之间的通信方式在变化时,每条边上的连接权重是变化的,很多学者对自适应一致性算法很感兴趣。对高阶多智能体系统一致性问题的研究,来源于自然界,例如自然界中排着规则队形的鸟类,由于遇到食物来源或者危险,原来的规则队形被打乱了,需要重新建立队形,各个个体不仅需要邻居的位置和速度的信息,还要需要加速度的信息。

3.随机一致性问题当拓扑结构是固定的,或者连续变化的拓扑是按一定顺序的,称作是确定的拓扑,即各智能体之间的通信连接是确定的,这种情况是在比较理想的情况下出现的。在现实中,由于通信介质、通信信道的限制,外部环境不确定的影响以及随机噪声的干扰,导致智能体之间的通信连接是随机变化的。例如,数据传输的过程中丢包的发生导致智能体之间的通信中断;一组机器人合作搬运大的物件,由于机器人自身携带的传感器受距离的限制,当2个智能体之间的距离超过此最大距离时,它们之间的通信就会中断;再或者个别的智能体为了绕开障碍物,可能会出现通信中断,当智能体移动到此最大距离范围之内,2个智能体之间开始建立通信,研究智能体之间的通信是随机变化的情况,是非常有意义的工作。当智能体之间通信的随机变化满足一定的条件时,即当前时刻的状态只依赖于前一时刻的状态,是马尔可夫链中的一个性质,因此可以借助随机过程的相关知识处理一致性问题。当智能体通信的变化满足马尔可夫链,且智能体之间各个状态差值平方的期望趋于0,称作是多智能体系统的均方一致性问题。

4.快速一致性收敛和有限时间一致性问题在多智能体系统中,因为收敛速度会影响系统的控制精度和抑制干扰的能力,也是衡量一个系统性能的重要指标,因此一致性收敛速度较快标志着系统性能较强。快速一致性收敛问题受到众多学者的关注。还有很多学者研究了有限时间一致性问题,与一般的一致性问题比较,在有限的时间内,各智能体的状态达到一致,称为有限时间一致性问题。

应用进展1.群集问题群集是由大量自治个体组成的集合。在无集中式控制和全局模型的情况下,通过个体的局部感知作用和相应的反应行为,使整体呈现出一致的行为。自然界中存在着大量的群集,如蚁群、鱼群、蜂群等,在运动中达到整体上的动态稳定。这些形式各异的群体运动,在广义上都是一种群集。由于不同种群间的差异,它们所显示出来的群集行为也不尽相同。关于群集的概念,至今没有一个明确的定义,目前普遍接受的群集的运动基本特点描述如下:a)智能体与智能体之间、智能体与障碍物之间不会发生碰撞;b)群集以某种队形或者蜂涌运动;c)可能会有其他的优化要求。群集的运动过程中要求群集中的智能体之间进行局部协作,整体上在某些方面达成一致,以求最终能完成任务。

2.蜂涌问题在一个多智能体系统中,所有的智能体最终能够达到速度矢量相等,相互间的距离稳定,称为蜂涌问题。蜂涌行为可以认为是群集的一种特殊情况。Reynolds于1987年提出了关于蜂涌运动的基本模型——Boid模型。该模型包含了三条启发式规则,用于描述单智能体如何依赖群中其他智能体的速度和距离而运动:a)分离性,各成员之间避免碰撞;b)内聚性,各成员朝着一个平均的位置进行聚合;c)排列性,各成员沿着一个平均的方向共同运动,尽量与邻居范围内的群体成员保持速度匹配。

3.聚集问题一群移动的智能体最后能够在某一点聚集,称为聚集问题。聚集问题的发展源于机器人应用的发展,如一群机器人要合作完成一个任务,到达一个共同的地点,在一片未知的地方进行搜救工作,或者一群无人驾驶飞机要达到一个共同地点等。聚集是一类特殊的一致性问题,聚集表示位置一致,聚集问题属于无约束一致性问题,是为了设计一种局部控制策略,使得所有的智能体最终聚集在同一个未知点。

  1. 传感器网络估计问题4.1分布式卡尔曼滤波

网络级的估计问题一直受到不少学者的关注,近几年分布式传感器网络迅速发展,研究重点主要集中在分布式卡尔曼滤波,每个传感器仅与部分传感器进行信息交换。

4.2网络丢包估计问题

丢包情况认为是由一个有限状态的马尔科夫过程下有界发生和驱动2。