本周早些时候,Google DeepMind发布了通用机器人资源,并将其推向了一个新的高度。这被认为是机器人领域的ImageNet时刻,因为它不再需要为每个特定任务单独训练机器人模型,而是通过机器人之间的知识传递来实现。
与此同时,让我们来看一看其他通用任务和操作的模型和机器人。
RT-X
RT-X,或称Robotics Transformer X,是由Google DeepMind开发的通用机器人模型,旨在提高各种机器人和任务的研究和性能。
其主要目标是创建一个可以将自己的技能推广到各种机器人和任务中的模型。它可以用于行动、视觉和语言理解,是一种全面的通用机器人研究工具。
RT-X建立在先前的两个机器人Transformer模型的基础上:RT-1和RT-2。RT-1是一个用于大规模实际机器人控制的模型,而RT-2是一个从Web和机器人数据中学习的视觉-语言-行动(VLA)模型。通过整合这些模型的架构和知识,RT-X实现了更高的性能,特别是由于它接受了广泛和多样化的跨机型数据训练。
RT-X的开发涉及对一个广泛而多样化的数据集进行训练,称为Open X-Embodiment数据集。根据论文介绍,该数据集是从22种不同的机器人模型中收集的数据,涵盖了各种技能和任务,共涉及150,000个任务,包括500种不同的技能。
RoboCat
RoboCat是由Google DeepMind开发的一种应用于机器人的人工智能代理,可以在不同的机器人系统上学习各种任务。RoboCat的独特之处在于它不仅可以掌握多个任务,还可以生成自己的训练数据来提高自己的技能。
通过使用广泛而多样化的数据集,它可以在仅展示100次演示的情况下迅速掌握新任务。这种快速学习的潜力是机器人研究中的一项有希望的进展,可以减少对广泛人工指导训练的需求。
RoboCat是谷歌的多模态Gato模型与广泛训练数据集的融合产物,该数据集包括来自各种任务的图像-动作序列的数据,这些任务涉及多种机器人手臂。
Dactyl
Dactyl是由OpenAI开发的,它在计算机模拟中进行训练,然后在现实世界中应用,尽管存在一些模拟精度上的差异。专用的Shadow Dexterous Hand使得Dactyl能够像操纵积木或棱柱一样操作物体,并采用了类似于OpenAI Five的学习方法。
Dactyl专门处理机器人手持物体时改变物体位置的任务,例如旋转方块。对于精确的抓握,例如 Tip Pinch 抓握,Dactyl巧妙地使用拇指和小指,这与人类如何使用拇指与食指或中指相似。
然而,Dactyl机器人手上的小指由于额外的运动方式更灵活。这就是为什么Dactyl经常选择使用小指的原因。实质上,Dactyl能够像人类一样独立发现抓握方式,但会根据自身手的能力和限制进行调整。
Jaco Arm
由Kinova Robotics开发的Jaco Arm是一款轻便的辅助机器人,旨在弥补运动功能的丧失。它由六个相连的段组成,包括一个三指手。用户可以利用可调控的控制器在三维空间中控制手的运动和对象的抓握/释放,可以使用两个或三个手指。
该机械臂可安装在轮椅、工作站或桌子上,在不扩大轮椅扶手的情况下放置在轮椅的扶手下方。Jaco可以提升行动不便人士的日常活动能力,而不妨碍轮椅的移动性。
关键组件包括由直流无刷电机驱动的执行器,采用谐波传动技术,并配备多种传感器以实现精确控制。夹具设计用于抓握各种日常物品,欠驱动夹具简化了控制并适应物体的形状。
界面选项包括软件开发工具包(SDK)、ROS包和游戏手柄,为用户提供对机器人运动的灵活控制。
Panda Arm
Panda Arm是由德国机器人平台公司Franka Emika开发的机械臂。该机器人具有各种功能,并配备传感器,以在出现意外干扰时停止运动,以防止事故发生。它具有特殊的手,可以牢固地握紧物体,就像人类的手臂一样。这只手可以承重高达3千克。这使得机器人能够几乎像人的手臂一样抓取各种物体。
该机械臂被应用于生产线,而且其应用领域众多,包括养老院、实验室、大学、物流平台等等。