谷歌公司旗下的人工智能研究部门DeepMind公布了三项新的进展,它表示这些进展将帮助机器人在野外做出更好、更快速和更安全的决定。
这些进展包括针对设计用于驱动自主机器人的人工智能系统的新训练系统,这些提升改进了机器人收集数据的方式,并增强了它们的概括能力,以及其他方面。
DeepMind表示,其宣布的研究目标是创建可以更好理解并执行更复杂任务的机器人,而不需要为每个任务从零开始训练。
AutoRT
首项进展是一个名为AutoRT的新AI训练系统,它结合了大型语言模型和视觉语言模型,以及针对机器人的专用算法。其目标是扩展机器人的学习能力,并教会它们执行有用的现实世界应用。
据DeepMind介绍,AutoRT是一种可以帮助同时教授多个机器人在不同环境中执行不同任务的技术。机器人利用VLM(视觉语言模型)来理解环境和它看到的对象,同时部署LLM(大型语言模型)来建议和选择适当的任务让机器人去执行。
AutoRT系统经过了长达七个月的广泛测试,并且安全地同时训练了20个机器人。总体来说,DeepMind生成了一个包含77,000个机器人试验的丰富数据集,这些试验包括它们执行了6,650个独立任务。
DeepMind解释说,AutoRT纳入了一部“机器人宪法”,它将安全规则应用到基于LLM的决策者。这些规则基于艾萨克·阿西莫夫的机器人三定律,其中规定了人类安全始终排在第一位,机器人应避免涉及人类、动物、电子设备或尖锐物品的任何任务。
此外,它还依赖于应用于传统机器人的既定安全规则。例如,如果机器人在执行任务时受到超出某个限制的压力,比如尝试举起一个太重的物体,它会自动停止执行任务。
SARA-RT
第二个系统“自适应鲁棒注意力机器人变压器”(Self-Adaptive Robust Attention for Robotics Transformers,简称SARA-RT),旨在帮助机器人变压器模型以最高效的方式学习执行新任务。
DeepMind解释说,它使用一种称为“上层训练”(up-training)的技术来微调机器人变压器模型。这样做的效果是将“二次复杂性转换为仅线性复杂性”,减少了原始模型的计算工作量,同时提高了它的速度。
DeepMind的研究人员表示,SARA-RT是“第一个能够提供计算改进且无损质量的可伸缩注意力机制”。
他们解释说,SARA-RT可以应用于多种变压器模型,包括那些处理机器人深度摄像头的空间数据,扩大了它们在机器人工业中的应用。
RT-轨迹
最后,在一个名为RT-Trajectory的新型AI模型中,DeepMind概述了在训练视频中引入视觉轮廓到机器人运动描述的新技术。通过这样做,它可以帮助机器人更有效地泛化并改进它们对如何执行特定任务的理解。
这项新技术的工作原理是,在培训视频中叠加机器人手臂的2D轨迹草图,为模型提供了一个更便捷的低级视觉线索,辅助学习机器人控制策略。
研究人员进行了一项测试,该测试包括在一个由RT-Trajectory驱动的机器手臂上执行的41项未知任务,发现它的性能是现有模型的两倍多。总体来说,它实现了63%的任务成功率,相比之下,一种称为RT-2的旧技术的成功率为29%。
DeepMind表示,它希望这些新系统会被机器人工业采用,并帮助构建更安全、更高效和更有用的机器人,这些机器人可以执行更广泛的任务。