NVIDIA的新研究帮助机器人抓取物体
2019年09月11日 由 KING 发表
410015
0
NVIDIA在西雅图的机器人实验室开发了一种新算法,称为6-DoF GraspNet,该算法可以帮助机器人抓取任意物体。
抓取是机器人系统的重要组成部分。机器人抓取物体可不像人类一样简单,甚至比我们想象的要复杂得多。它首先需要观察物体,确定物体在6D空间(3D位置和3D旋转)中的位置,然后把它的抓取器准确的移动到物体上进行抓取动作。但是抓取的成功与否取决于物体和夹持器的几何结构、物体的质量分布和表面摩擦。
对于机器人来说,如果一个待抓取物体的大致形状已经保存到数据库中,它可以利用数据集中的抓取数据调整抓取器的姿势,进而抓取物体。但是数据集不能囊括全部的物体类别,这限制了机器人可以与之交互的物体数量。而对于数据库中没有的物体类别,随着6-DoF GraspNet抓取空间的显著增大,抓取问题变得更加具有挑战性。为了简化这一问题,以往的方法都是通过在图像平面上用一个矢量矩形表示抓取对象的形状,这样的表示方式约束了抓取垂直于目标对象的支撑面,导致机器人的工作空间受到严重限制。6-DoF GraspNet通过直接从部分观测到的点生成一组不同的6-DoF GraspNet的抓取姿势来打破这些限制。
6-DoF GraspNet由抓取采样、抓取评价和抓取细化三部分组成。抓取采样器是一个自动编码器,它将抓取动作和观测到的点映射成一个潜在值,假设潜在值是正态分布的。然后,每个生成的抓取动作都由抓取评估器分配一个分数。最后,抓取细化模块通过对生成的抓取动作局部变换来提高成功的概率。为了给机器人生成数据集通常需要多个机器人连续几天或几个月收集数据,以获得足够的数据来训练模型。相反,6自由度的GraspNet使用合成的训练数据。它由三维对象模型和模拟的抓取实验组成。对于每个对象,使用几何启发式生成抓取假设,并使用NVIDIA FleX物理引擎进行评估。
在训练过程中,以随机的视点呈现对象,生成点云,并利用模拟的抓取来学习模型的参数。模型由随机的盒子、圆筒、杯子、碗和瓶子组成。该模型采用8台NVIDIA V100 GPU进行训练。6-DoF GraspNet的优点在于它是模块化的,可以与其他计算机视觉和运动规划算法一起使用,而不是端到端的解决所有问题。对于待抓取物体场景中的其他物体它用立方体近似表示为运动规划模块的障碍物,这样机器人手臂就不会与场景中的其他物体发生碰撞。