谷歌的机械手AI新进展

2019年09月30日 由 TGS 发表 955041 0
同时使用几根手指来抓取和操纵物体对人类来说是一个很简单的要求,但机器人要做到就困难得多,像用铅笔在纸上写字这样的任务需要物理模型来指导向目标物体施加的力,以及反复建立和断开触点,而对于传统的右旋操作方法,机器模型则往往很难准确完成。
为了解决这个问题,谷歌Brain研究人员开始追求一种新的机器人任务规划技术,以及深度动力学模型(DDM)。在上周发表在arxiv.org的一篇论文中,他们声称,通过研究实验,已经能做到使一只机械手只用四个小时的真实数据训练就能操纵多个物体。
“无模型(机器学习)方法可以学习在复杂(机器人操作)任务中取得良好表现的策略。然而一旦需要高度灵活性时,这些最先进的算法就会遇到困难,”合著者在论文中写道,“复杂的接触动力学和任务失败的高几率使得整体技能训练更加困难,这导致没有模型的方法也需要大量的数据,所以它们很难在现实世界中使用。”

因此,该团队将他们的“不确定性感知”人工智能模型与最先进的轨迹优化相结合,利用强化学习(Reinforcement learning)来推动软件策略朝着目标前进,帮助教授系统微妙的手势和对象交互,每个动作都被计算为多个机器学习模型的平均预测奖励。这些模型被用来优化一个候选的动作序列,实验中,最难的一项是将两个保定球在手掌上旋转而不让它们掉下来,但研究人员的新模型却出人意料的只用了10万个数据点(2.7小时)就解决了这个问题。
在随后的一项旨在研究该系统灵活性的测试中,研究小组在模拟环境中进行了手写实验。他们表示,该方法将建模和特定于任务的控制分离开来,这对跨行为的泛化非常重要。
在另一项实验中,研究小组将在保定球任务中接受训练的模型进行了重新设定,以完成其他不需要额外训练的任务,包括将机器人手中的一个球移动到目标位置,以及顺时针旋转。最终,机器人成功地将两个球旋转了90度和180度,成功率分别为100%和54%。
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
写评论取消
回复取消