为了教会 AI Agent 新技能,比如打开厨房橱柜,研究者通常采用强化学习方法。这是一种试错过程,AI Agent 通过采取正确的行动接近目标而获得奖励。
2023-11-30 09:31:10
收藏只需要几分钟,就可以成功模仿专家行为,并记住所有学过的知识,Google DeepMind 研发的 AI Agent,登上了 Nature 子刊。
2023-11-29 10:20:52
收藏尽管大模型在流利性和知识广度方面貌似已接近人类水平,但评估它们的挑战日益突显。随着大模型的迅猛发展,一些传统基准已经失效。因此,新的测评基准亟需制定。
2023-11-26 08:51:50
收藏在我们的宏观世界中,时间似乎总是稳定的,以秒为单位流逝。然而,当我们进入微观世界,时光变得无比狂野,它像一匹狂奔的闪电,只在最短的瞬间内闪过。
2023-11-10 09:12:25
收藏