郭鑫宇 王瑞兵 梁栋 贺瑾瑜 张健
北方自动控制技术研究所 030006
摘 要:对于指挥控制结构的任务规划,现有算法在非正常条件下效率低下,重规划质量差。针对当前指控体系结构的需求,利用多智能体在完成复杂任务方面的优势,建立了基于多智能体的分布式指控体系结构模型。在此框架的基础上提出了MultiAgent-HTN的概念。对原有的分层任务网络规划算法进行了优化,重新定义了多智能体协作框架,建立了局部冲突协调机制。以经典的资源调度问题为实验背景,将该算法与经典的 HTN 算法进行了比较。 结论表明,本文提出的分布式指挥控制结构在相关领域具有较强的实用性,能够解决多智能体环境下的分布式指挥控制结构问题。
关键词:分布式指挥系统 多任务调度 技术研究
一.引言
目前,分布式规划的优化方法有很多,主要分为三种: 数值分析法、启发式算法和混合算法。目前常用的数值分析方法有线性规划法、非线性规划法、支路交换法、支路划分法、枚举法、动态规划法、随机规划法和模糊规划法。数值分析方法的原理相对简单,并且具有很高的可操作性。然而,对于复杂的分布式资源规划问题,不可能仅仅用数值分析方法来获得满意的最优解。 因此,如何形成一个均衡的联盟,使其朝着预期的方向发展,已成为人工智能研究的主要问题之一。由于应急响应的特殊性,指控体系结构具有拥有属性大、层次化决策、复杂的协同关系、强大的时空约束以及复杂的外部环境。
二. 分布式指挥系统分层多任务调度设计
2.1基于MultiAgent的分布式指挥控制结构模型
根据指挥控制决策功能的建模要求,可以得到指挥控制模型的 agent 结构框架,分布式指挥控制模型 旨在优化指定资源的利用,处理指挥控制过程中的局部矛盾,在满足任务要求的前提下降低模型结构的复杂性。下列变量是根据输入任务的时间约束、资源需求和其他约束定义的。分别表示指挥控制资源的分配变量、资源转移变量、时间变量和各方资源规划的数量,假定内部协作函数和外部协作函数为目标函数,是完成输入任务所需的时间。其目的是确保目标函数值和最小值,从而使内部协作和外部协作最不复杂。 然后,指挥控制模型的相关数学描述是混合元素线性规划问题,即状态空间搜索问题。对输入任务进行聚类分析。根据聚类结果将不同的任务分配给不同的代理,从而最小化代理的工作负载。复杂的任务处理决定了指挥控制中心的外部协作阈值。为了解决 agent 内部决策合作问题,需要确定 agent 之间的最大外部合作阈值,并将指挥控制结构中的间接合作阈值最小化。定义为直接联系变量,作为间接联系变量,内部协作函数表示单元内各成员协作能力的量化表达。
2.2 基于 HTN 的分布式协同任务规划算法优化
在指挥控制决策过程中,各个 agent 的态势信息不能完全共享,因此 agent 应该根据自己掌握的局部态势规划自己的利益最大化。
基于以上内容,为了避免代理人之间的相互作用,消除局部冲突或提高资源利用率,应对分布式协同任务进行规划,以确保全局任务的完成和整体利益的最大化。为此,本章主要描述了分布式多智能体在指挥控制决策中的协作关系。以任务规划为背景,构建了指挥控制决策环节的多智能体协同模式和关系网络。HTN 决策系统在人工智能领域的规划系统中得到了广泛的应用。HTN 表示根据原子操作符的概念进行的状态变化,一组原子操作符表示一个状态。HTN 的基本原理是基于目标或任务生成一系列指令动作,并输入给定的问题域或任务(例如,进程的初始测试状态) ,状态是有序未完成任务集的顺序。
2.3基于 HTN 的多 agent 分布式协作框架
在集中式环境下,多 agent-HTN (MultiAgent-Hierarchical Task Network Planning,MA-HTN)协作框架通常是建立一个决策中心,控制全局,推导和解决方案。然而,在实际的指挥控制过程中,难以实现全局共享,单一决策中心的安全性难以保证。一旦中心被摧毁,它就失去了战争的主动权。因此,分布式 MA-HTN 具有较高的优越性。每个代理人在内部对计划进行演绎,在计划演绎过程中不与其他代理人共享相关信息。此外,每个代理应该与具有依赖关系或互斥关系的方案合作,解决局部冲突,建立任务规划协作网络,使整体利益最大化。
分布式 MA-HTN 协同任务规划是在决策方案修改的基础上进行的。引入合作关系调整机制,整合决策调整和修正过程。从而在规划过程中实现了决策行为的协同关系控制。算法流程遵循原有的 HTN 规划框架,并增加了中间步骤(如潜在合作关系检测和态势信息共享)。该方法利用潜在的协作关系检测来检测代理的决策指令与其他代理生成的决策指令之间是否存在潜在的依赖或矛盾。在确定了潜在的合作关系后,态势交互模块将自己的态势信息和合作关系信息发布给其他代理,然后从其他代理节点接收信息。根据协作检测,根据情境信息交互的结果确定特定的协作关系,并通过协作关系调整机制处理特定的协作关系,使各 agent 的整体利益最大化。该算法流程不仅适用于任意两个独立主体之间的合作关系规划,而且适用于多个主体之间的合作规划。
一方面,分布式 MA-HTN 协同任务规划过程将协同机制集成到 HTN 中,从而同时制定和协同决策指令。因此,可以一次性产生一个与其他代理兼容的决策方案。另一方面,确认的合作关系可以尽快识别和处理。对原决策方案进行了修改,减少了调整后的决策指令的无效决策行为,甚至可能根本不需要作出相应的决策。总之,与传统的多智能体协作算法流程框架相比,该算法在减少全局决策生成时间和提高协作效率方面具有更大的优势。
三.结束语
随着地方纠纷和突发事件的频繁发生,世界范围内越来越多的学者开始关注如何制定应对突发事件的决策方案。决策方案的基本目标是实现尽可能减少人员伤亡和财产损失的完整方案的战术目标。此外,该方案实施后,应尽可能缩短方案的生成时间,并迅速有效地协调当地纠纷。作为一种高效的智能规划算法,HTN 具有较好的适应性和较高的求解效率,这是本文提出的算法框架的基础。针对当前指挥控制结构的需求,构建了一种基于多智能体的分布式指挥控制结构模型。利用多智能体的高协作效率和解决复杂问题的优势,解决了突发事件数据量大、情境复杂的问题。在 HTN 算法的基础上,提出了一种多智能体 HTN 算法框架,并对该算法进行了全面的仿真和比较。实验结果表明,该算法具有较高的实用性和研究价值,可用于解决数据量大、情况复杂的复杂问题。此外,它还具有较高的适应性和较强的自我协作能力。
参考文献:
[1]何维,王道阔,何宇峰. 基于城轨云的沈阳地铁线网指挥中心系统方案设计[J]. 中国勘察设计,2021,(02):88-91.
[2]郝江波,唐卫,王慕华,丰德恩,赵瑞,袁亚男. 基于微服务的气象信息决策支撑系统重构与实践[J]. 气象科技,2020,48(06):829-835.
[3]于爱荣,王俊,牛彦杰,王远阳. 基于ISE算法的内场通信抗干扰试验任务调度研究[J]. 计算机技术与发展,2020,30(12):153-158.