地震、台风等灾害后,基础设施网络(如电网、水网)的快速恢复关乎城市运转。但传统维修调度常陷入“各自为战”的困境:多个团队重复作业、路线绕远,导致恢复时间延长。近日,北京航空航天大学团队提出一种基于深度强化学习的AC-MCTS算法,通过AI“全局指挥+沙盘推演”模式,让多维修团队协同效率显著提升。在228节点电网模拟中,该算法相比传统方法将恢复时间缩短近20%,弹性损失(衡量网络功能恢复的综合指标)降低14%,相关成果发表于《Frontiers of Engineering Management》。

灾后维修的“两难困境”:多团队协同为何这么难?
基础设施网络(IN)如同城市的“血管系统”,一旦因灾害受损(如电网节点和线路故障),需快速调度维修团队恢复。但现实中,这一过程常面临两大难题:一是路线规划难,维修团队可能因信息不对称绕远路,浪费时间;二是顺序决策难,先修哪个节点、哪条线路,直接影响整体恢复效率。传统方法要么依赖人工经验,要么采用单一团队调度模型,难以应对多团队、多任务的复杂场景。

以2021年某地区台风灾害为例,当地电网186条线路、62个节点受损,3个维修团队因调度混乱,部分团队重复奔赴同一区域,导致关键变电站修复延迟12小时,数十万用户停电超4天。“这就像没有指挥的交响乐,每个乐手自顾自演奏,结果一团糟。”研究团队解释,多团队协同需兼顾全局最优,而非单个团队的局部效率。

AI“指挥官”的双重智慧:从“军师献策”到“沙盘推演”
为破解这一难题,团队研发了AC-MCTS算法,核心是“演员-评论家神经网络(ACNN)+蒙特卡洛树搜索(MCTS)”的双重架构。简单说,ACNN像“军师”提供决策建议,MCTS则像“沙盘推演”模拟各种维修方案,最终选出最优策略。

ACNN的“全局视野”:它接收电网受损状态(如哪些节点/线路故障、团队当前位置),输出两个关键信息——“先验概率矩阵”(建议优先维修的节点/线路)和“价值评估”(预测该决策的恢复效果)。例如,当检测到某变电站(一级节点)故障,ACNN会赋予其更高的维修优先级,就像急诊医生优先处理危重症患者。

MCTS的“推演能力”:基于ACNN的建议,MCTS会模拟未来多步维修动作,比如“团队A先修线路(i,j)再修节点j,团队B先修节点k”,通过上万次“推演”计算每种方案的弹性损失和恢复时间,最终选择全局最优解。这种“瞻前顾后”的能力,避免了传统算法“走一步看一步”的局限。

更巧妙的是双层决策架构:舰队级(协调多个团队)和团队级(优化单个团队路线)。前者确保团队间不重复作业,后者规划最短维修路径。例如,在228节点电网中,5个团队分别负责不同区域,AC-MCTS会动态调整任务分配,让高能力团队处理复杂节点(如变电站),普通团队修复简单线路。

实测验证:228节点电网恢复时间缩短近20%
团队在Python中模拟了4种电网受损场景(随机生成灾害中心和半径),对比AC-MCTS与PPO、DDPG等5种算法的表现。以最严重的案例1为例:62个节点、186条线路受损,3个维修团队参与恢复。结果显示,AC-MCTS算法实现恢复时间984小时,弹性损失202.45,而传统HHG方法恢复时间1011小时,弹性损失256.5;即便是先进的PPO算法,恢复时间也长达1034小时,弹性损失232.3。

更关键的是,AC-MCTS的效率稳定性:随着受损规模增大(如从34个节点增至62个节点),其运行时间仅从84秒增至97秒,而传统ASC方法从208秒飙升至312秒。“这意味着在大规模灾害后,AI指挥官能快速响应,不会因数据量激增而‘卡顿’。”团队补充。

从电网到“城市血管”:AI调度未来可期
该算法不仅适用于电网,还可推广到水网、交通网络等基础设施。例如,城市供水管道破裂后,算法能调度维修团队优先修复主干管道,减少居民断水时间。未来,团队计划进一步研究“初始资源分配”问题,让维修团队在灾害发生前就完成最优部署,同时探索多智能体DRL,让每个团队具备自主协调能力。

专家评价,这种“AI+基础设施恢复”的模式,为城市韧性建设提供了新思路——当灾害来临时,我们或许能比以往更快地按下“重启键”。

来源: 工程管理前沿