视频
版权归原作者所有,如有侵权,请联系我们
视频简介: 作者主要介绍了用博弈论的工具,将信任区域策略优化用于多智能体,在多智能体深度强化学习里,以梯度博弈的角度去分析。
来源:Wiz平台-温颖
内容资源由项目单位提供