你知道吗?光缆是5G和互联网的“血管”,但生产中光纤分配常像“乱搭积木”——选太长浪费材料,库存久的没优先用,彩色光纤和回收光纤优先级难平衡。人工分配慢还易出错,传统算法在复杂订单下总“掉链子”。近日,我国武汉科技大学、华东师范大学等团队联合提出D3QNTF智能光纤分配模型,用深度强化学习(让AI通过试错学最优决策,像小孩学走路)解决了这个难题,相关成果发表在《Frontiers in Engineering Management》。

光缆生产的“老大难”:多目标优化像“走迷宫”

光纤分配是典型的多目标优化问题(同时优化多个冲突目标,比如省材料又高效)。关键因素包括:光纤长度(太长浪费)、库存时间(久的优先用)、颜色(彩色优先)、回收光纤(优先用)。传统方法如贪心算法(只看眼前最优,易浪费)、遗传算法(靠“进化”找方案,参数敏感),在复杂订单(比如同时生产3种不同长度光缆)下效率骤降——分段光纤变多、分配次数增加,直接拉高成本。

D3QNTF模型:AI里的“聪明调度员”

D3QNTF是在D3QN(决斗式双深度Q网络,更稳定的AI决策模型)基础上改进的新模型,核心有三大“聪明设计”:

  1. 双函数防高估:把决策拆成“状态价值”(当前库存好不好)和“动作优势”(选这个光纤有多划算),避免AI过分自信选错动作,决策更稳;
  2. 随机初始化可行解:一开始就给AI“正确练习样本”,不用盲目试错,学习更快;
  3. 惩罚非法动作:比如选超过库存长度的光纤会被扣分,让AI少犯错。

简单说,这个模型就像给工厂配了个“智能调度员”,能自动平衡效率、成本和库存质量。

实验见真章:复杂订单下完胜传统算法

团队用真实工厂数据测试,对比贪心算法、遗传算法、DQN(深度Q网络,AI基础决策模型)等,结果亮眼:

  • 在最复杂的320+520+7*20订单(3/5/7为长度,20为 bundle数)下,D3QNTF的**库存分数提升0.43%**(库存质量更好),**分段光纤减少26.67%**(省材料),分配次数更合理
  • 和D3QN相比,收敛更稳定,回报值更高,不会中途“掉链子”。

美中不足:还要跨几道坎

模型虽强,但也有局限:

  • 目前只处理固定配置订单,面对临时加单、改规格的多样客户需求还需优化;
  • 需要更多实际工厂数据验证通用性。

未来团队计划扩展到多订单场景,让模型更“万能”。

AI赋能智能制造:制造业转型的“加速器”

我国制造业正加速向智能制造转型,AI在生产调度中的应用是关键。D3QNTF模型不仅能降低光缆生产的材料浪费和成本,还为其他制造领域(如汽车、电子)的资源分配提供了参考,助力我国制造业“提质增效”。

来源: 工程管理前沿