视频
版权归原作者所有,如有侵权,请联系我们
视频简介: 在本次报告中,将介绍近期在迁移强化学习方面做的三个工作。一是用于非稳态马尔科夫博弈任务的深度贝叶斯策略重用方法,二是基于策略重用思想的策略迁移框架,三是基于鲁棒环境推理的策略自适应方法。
来源:CCF DL-章宗长
内容资源由项目单位提供