你知道吗?光缆是5G和互联网的“血管”,但生产中光纤分配常像“乱搭积木”——选太长浪费材料,库存久的没优先用,彩色光纤和回收光纤优先级难平衡。人工分配慢还易出错,传统算法在复杂订单下总“掉链子”。近日,我国武汉科技大学、华东师范大学等团队联合提出D3QNTF智能光纤分配模型,用深度强化学习(让AI通过试错学最优决策,像小孩学走路)解决了这个难题,相关成果发表在《Frontiers in Engineering Management》。
光缆生产的“老大难”:多目标优化像“走迷宫”
光纤分配是典型的多目标优化问题(同时优化多个冲突目标,比如省材料又高效)。关键因素包括:光纤长度(太长浪费)、库存时间(久的优先用)、颜色(彩色优先)、回收光纤(优先用)。传统方法如贪心算法(只看眼前最优,易浪费)、遗传算法(靠“进化”找方案,参数敏感),在复杂订单(比如同时生产3种不同长度光缆)下效率骤降——分段光纤变多、分配次数增加,直接拉高成本。
D3QNTF模型:AI里的“聪明调度员”
D3QNTF是在D3QN(决斗式双深度Q网络,更稳定的AI决策模型)基础上改进的新模型,核心有三大“聪明设计”:
- 双函数防高估:把决策拆成“状态价值”(当前库存好不好)和“动作优势”(选这个光纤有多划算),避免AI过分自信选错动作,决策更稳;
- 随机初始化可行解:一开始就给AI“正确练习样本”,不用盲目试错,学习更快;
- 惩罚非法动作:比如选超过库存长度的光纤会被扣分,让AI少犯错。
简单说,这个模型就像给工厂配了个“智能调度员”,能自动平衡效率、成本和库存质量。
实验见真章:复杂订单下完胜传统算法
团队用真实工厂数据测试,对比贪心算法、遗传算法、DQN(深度Q网络,AI基础决策模型)等,结果亮眼:
- 在最复杂的320+520+7*20订单(3/5/7为长度,20为 bundle数)下,D3QNTF的**库存分数提升0.43%**(库存质量更好),**分段光纤减少26.67%**(省材料),分配次数更合理;
- 和D3QN相比,收敛更稳定,回报值更高,不会中途“掉链子”。
美中不足:还要跨几道坎
模型虽强,但也有局限:
- 目前只处理固定配置订单,面对临时加单、改规格的多样客户需求还需优化;
- 需要更多实际工厂数据验证通用性。
未来团队计划扩展到多订单场景,让模型更“万能”。
AI赋能智能制造:制造业转型的“加速器”
我国制造业正加速向智能制造转型,AI在生产调度中的应用是关键。D3QNTF模型不仅能降低光缆生产的材料浪费和成本,还为其他制造领域(如汽车、电子)的资源分配提供了参考,助力我国制造业“提质增效”。
来源: 工程管理前沿
科普中国公众号
科普中国微博

帮助
Engineering前沿