谷歌教机器人通过与环境的交互来识别物体
2018年12月12日 由 浅浅 发表
200827
0
谷歌希望使AI系统至少在对象识别和感知方面,能像儿童那样思考。在论文“Grasp2Vec: Learning Object Representations from Self-Supervised Grasping”和随附的博客文章中,谷歌机器人部门的软件工程师Eric Jang和伯克利大学的博士生Coline Devin描述了一种算法,名为Grasp2Vec,可以通过观察和操纵物体来“学习”物体特征。
几个月前,
OpenAI展示了一种名为“Dense Object Nets”(简称DON)的
计算机视觉系统,该系统允许机器人检查、视觉理解和操纵他们从未见过的对象。谷歌的研究人员解释说,这是基于对自我监督的认知发展研究。
人们通过与环境相互作用获得关于世界的知识,关于物体持久性的经过时间检验的研究已经表明,随着时间的推移,人们会从他们所采取的行动的结果中学习。即使是抓住一个物体也能发现很多关于它的信息,例如,它必须在抓住之前的瞬间是在可及范围内的。
Jang和Devin写道,“在机器人领域,研究者正在积极研究这种类型的学习,因为它使机器人系统能够在不需要大量训练数据或人工监督的情况下学习,通过使用这种形式的自我监督,机器人可以通过场景中的视觉变化来学习识别对象。”
该团队与X Robotics合作,教导一个机器人手臂能够无意间抓住物体,并能在训练过程中学习各种物体的表现。这些表现最终导致它有意识地抓住研究人员选择的工具和玩具。
该团队利用强化学习,使用奖励系统驱动智能体达到特定目标,如鼓励手臂抓住物体,用相机检查物体,并回答基本的物体识别问题,如“这些物体是否匹配”。他们部署了一种感知系统,可以通过分析一系列三个图像来提取有关项目的有意义的信息:抓取前的图像,抓取后的图像,以及抓取对象的独立视图。
在测试中,Grasp2Vec和研究人员的新策略取得了80%的成功率,即使在多个对象与目标匹配且目标由多个对象组成的情况下也能工作。
团队表示,“我们展示了机器人抓取技能,它们能够生成用于学习以对象为中心表征的数据,然后,我们可以使用表征学习引导更复杂的技能,如实例抓取,同时保留自主抓取系统的自我监督学习属性。展望未来,我们不仅希望看到通过更好的感知和控制,机器学习为机器人技术带来什么,还希望看到机器人技术在新的自我监督范式中为机器学习带来什么。”
论文:
arxiv.org/abs/1811.06964
博客:
ai.googleblog.com/2018/12/grasp2vec-learning-object.html