当地震或台风导致电网瘫痪,如何快速调度多个维修团队恢复供电?传统方法常因路线重叠、顺序混乱延长恢复时间。近日,北京航空航天大学团队提出基于深度强化学习的AC-MCTS算法,通过AI“全局指挥+沙盘推演”模式,让多团队协同效率显著提升。在228节点电网模拟中,该算法将恢复时间缩短近20%,弹性损失降低14%,为城市基础设施灾后快速重建提供新思路,相关成果发表于《Frontiers of Engineering Management》。
多团队维修为何总“打乱仗”?
基础设施网络(如电网、交通网)是城市的“生命线”,但灾害后的修复堪称“复杂系统工程”。想象一个场景:某区域电网62个节点、186条线路受损,3个维修团队同时作业——A队奔赴城东修复线路,B队却已在附近抢修;C队耗时3小时赶到偏远变电站,却发现关键工具未带齐……这种“各自为战”的混乱,根源在于传统调度方法存在两大短板:
局部最优陷阱:单一团队调度算法(如LSTM)只关注自身效率,可能导致多团队重复作业。例如2021年某台风灾害中,两个团队同时赶往同一变电站,浪费4小时抢修时间。
短视决策困境:人工调度依赖经验,难以预判维修顺序对整体网络的影响。比如优先修复次要线路,可能导致主干电网恢复延迟,数十万用户停电时间延长。
“这就像没有GPS的车队穿越迷宫,每个司机只看眼前路况,整体必然低效。”研究团队表示,多团队协同需破解“路线规划”与“顺序决策”的双重难题,而AI正是突破这一瓶颈的关键。
AI“指挥官”如何调度千军万马?
AC-MCTS算法的核心是“演员-评论家神经网络(ACNN)+蒙特卡洛树搜索(MCTS)”的黄金组合。简单说,ACNN像“军师”提供决策建议,MCTS则像“沙盘推演”模拟最优方案,二者协同实现全局调度。
ACNN的“火眼金睛”:它接收电网实时状态(故障节点位置、团队当前坐标、维修能力),输出“维修优先级地图”。例如,一级变电站(权重>4)故障会被标红,普通线路(权重<2)标蓝,就像急诊室的“三色分诊”系统,确保资源投向最关键处。
MCTS的“时空推演”:基于ACNN的建议,MCTS会模拟未来100步维修动作。比如“团队A先修线路(i,j)再修节点j,团队B同步修复节点k”,通过上万次虚拟演练,计算每种方案的恢复时间和弹性损失(网络功能损失的量化指标)。这种“瞻前顾后”的能力,让算法能提前规避路线冲突,就像下棋时预判对手下一步。
更巧妙的是双层决策机制:舰队层协调多团队分工,避免重复作业;团队层优化个体路线,缩短移动时间。例如在228节点电网中,算法会让高能力团队(如Crew 1,修复一级节点仅需1小时)主攻关键变电站,普通团队负责周边线路,实现“人尽其才”。
模拟测试:恢复时间缩短近20%,弹性损失降低14%
团队在Python中模拟了4种电网灾害场景(故障节点34-62个),对比AC-MCTS与PPO、DDPG等5种主流算法。在最严重的Case 1中:
- 恢复速度:AC-MCTS耗时984小时,较传统HHG方法(1011小时)缩短2.7%,较先进的PPO算法(1034小时)缩短4.8%;若增加至5个团队,恢复时间进一步压缩至670小时。
- 恢复质量:弹性损失(RL)降至202.45,较HHG方法(256.5)降低21%,意味着网络功能损失更小。
- 效率稳定性:面对62个故障节点,AC-MCTS运行时间仅97.6秒,而传统ASC算法需312秒,证明其在大规模灾害中仍能高效决策。
“这相当于将原本10天的恢复周期压缩到8天,减少数亿元经济损失。”团队强调,算法的优势在多团队场景下更明显——团队越多,协同优化空间越大,传统方法的调度混乱问题也越突出。
从模拟到现实:AI调度离实战还有多远?
目前,该算法已在228节点电网模拟中验证有效性,但尚未应用于真实灾害场景。研究团队表示,下一步将重点突破两大瓶颈:一是动态环境适应,比如应对灾害现场突发的道路堵塞、团队失联;二是多网络协同,如同时调度电网、水网、交通网的维修资源。
专家认为,这种“AI+基础设施韧性”的范式,为城市防灾减灾提供了新工具。未来,当地震、台风等灾害发生时,AI或许能成为“隐形指挥官”,让维修团队像精密齿轮般高效运转,更快恢复城市“生命线”。
来源: 工程管理前沿