DeepMind教代理从零到推动新算法控制对象

DeepMind发表一篇博客文章中,一个称为囊- X新的学习模式的辅助控制(计划),旨在解决人工智能以最小的先验知识,从一开始学习复杂控制问题的挑战。

这一成功在机械臂的实际环境学习对象从一开始。SAC – X是基于这个想法从头学习复杂的任务,也就是说,一个智能体首先应该学习和掌握的基本技能。像个婴儿在爬行或走路必须协调和平衡能力,为代理商提供简单的技能,对应于固有目标(辅助功能),它会增加理解和更复杂的任务的可能性。研究人员认为,SAC – X是一种常见的强化学习方法,未来可以应用到更广阔的区域以外的机器人。

发表评论

电子邮件地址不会被公开。 必填项已用*标注