MIT突破：自我监督系统DON，机器人可在检查随机物体后理解它们并拾取

2018年09月10日由浅浅发表 939128 0

几十年来，装配线等受控环境中的机器人能够一次又一次地拾取同一物体。最近，计算机视觉的突破使机器人能够在物体之间进行基本区分。尽管如此，系统并没有真正理解物体的形状，因此机器人在快速拾取后几乎没什么用了。

麻省理工学院计算机科学与人工智能实验室（CSAIL）的研究人员在一篇新论文中说，他们已经在这个工作领域做了一个重要的发展：一个允许机器人检查随机物体，并在视觉上理解它们，以完成具体的系统，而不需要以前见过任务物体。

[video width="1280" height="720" mp4="https://www.atyun.com/uploadfile/2018/09/Robots-Teaching-Themselves-to-See.mp4"][/video]

该系统称为Dense Object Nets（DON），它将对象视为点集合，用作视觉路线图。这种方法可以让机器人更好地理解和操纵物品，最重要的是，它们甚至可以让他们甚至在类似的混乱中拾取特定物品，这是亚马逊和沃尔玛等公司在其仓库中使用的各种机器的宝贵技能。

例如，有人可能会使用DON让机器人抓住物体上的特定位置，比如鞋舌头。从那以后，它可以看到它以前从未见过的鞋子，并成功抓住它的舌头。

“许多操纵方法无法识别物体可能遇到的多个方向的物体的特定部分，”博士生Lucas Manuelli说道，他与主要作者和博士生Pete Florence，Russ Tedrake教授一起撰写了一篇关于该系统的新论文，“例如，现有的算法无法通过手柄抓住一个杯子，特别是杯子是多个方向的，如直立，或侧面。”

该团队不仅在制造环境中，而且在家庭中都看到了该系统潜在的应用。想象一下，给系统一个整洁的房子的图像，让你在工作时清洁，或使用菜肴的图像，以便系统在你度假时把你的盘子放好。

还值得注意的是，没有一个数据实际上被人类标记过。相反，该系统是团队所谓的“自我监督”，不需要任何人类注释。

机器人抓取的两种常见方法涉及任务特定学习或创建一般抓取算法。这些技术都有障碍：特定于任务的方法难以推广到其他任务，并且一般的掌握不足以处理特定任务的细微差别，例如将对象放在特定位置。

然而，DON系统基本上在给定物体上创建一系列坐标，作为一种视觉路线图，使机器人更好地理解它需要掌握的内容，以及在哪里。

该团队训练系统将对象视为构成较大坐标系的一系列点。然后，它可以将不同的点映射到一起，以显示对象的3D形状，类似于从多张照片拼接全景照片的方式。在训练之后，如果一个人指定一个物体上的一个点，机器人可以拍摄该物体的照片，并识别和匹配点，然后能够在该指定点拾取物体。

这与UC-Berkeley的DexNet系统不同，后者可以掌握许多不同的项目，但不能满足特定的要求。想象一个18个月大的孩子，他不明白你想要它玩哪个玩具但仍然可以抓住很多物品，而一个4岁的孩子可以回应“抓住你的卡车红色的尾部”。

在软毛虫玩具上进行的一组测试中，由DON驱动的Kuka机器人手臂可以从一系列不同的配置中抓住玩具的右耳。这表明，除其他外，系统具有在对称物体上区分左右的能力。

当在不同棒球帽的箱子上进行测试时，DON可以选择特定的目标帽子，尽管所有的帽子都具有非常相似的设计，并且之前从未在训练数据中看过帽子的照片。

Florence表示，“在工厂中，机器人通常需要复杂的零件供料器才能可靠地工作，但是像这样能够理解物体方向的系统可以拍摄照片，并能够相应地掌握和调整物体。”

在未来，团队希望将系统改进到能够执行特定任务的地方，更深入地了解相应的对象，例如学习如何抓住对象并将其移动到最终目标，即清理桌面。

该团队将于下个月在瑞士苏黎世举行的机器人学习会议上发表论文。

标签：

机器人 MIT麻省理工学院人工智能应用

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇英国诺福克警察局用算法决定入室盗窃调查是否正当，引发公众争议

下一篇 Smartcat为翻译自动化平台募集了700万美元

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来