英伟达通过推出 Project GR00T 项目,正在推动机器人技术的发展。该项目是一个多模态人工智能,旨在通过先进的基础人工智能为未来的类人机器人提供动力。
在圣何塞麦克恩里会议中心举行的 GTC 会议上,英伟达展示了 Project GR00T。该项目采用了一种通用基础模型,使类人机器人能够接收文本、语音、视频甚至现场演示作为输入,并对其进行处理以采取特定的通用行动。它得到了英伟达 Isaac 机器人平台工具的帮助,包括一个用于强化学习的新 Isaac Lab。
英伟达首席执行官黄仁勋在一份声明中表示:“为通用类人机器人构建基础模型是当今人工智能领域最激动人心的问题之一。如今,推动机器人技术发展的相关技术正在汇聚一堂,使世界各地的机器人技术专家能够迈出实现通用人工智能机器人的巨大步伐。”
为了帮助企业成功运行 GR00T,英伟达宣布了一款专为类人机器人设计的 Jetson Thor 芯片。此外,英伟达还分享了在构建人工智能驱动的工业操作臂以及能够在非结构化环境中导航的机器人方面的一些显著进展。
英伟达 Project GR00T 能带来什么?
虽然这个名字与漫威的 Groot 相似,但它实际上代表的是 Generalist Robot 00 Technology(通用机器人00技术)。据英伟达称,它被设计用来理解自然语言文本、语音、视频和现场演示,以模仿人类的动作——包括协调、灵巧和其他技能——并产生通用行动来导航、适应和与现实世界互动。
这不仅将增强类人机器人的能力,还将使它们的开发和部署变得非常容易。基本上,只要有文本和演示作为输入,任何人(拥有相关权限)都可以对机器人进行编程。
在 GTC 主题演讲中,黄仁勋展示了多个由 GR00T 驱动的类人机器人完成各种任务的情况,其中包括来自 Agility Robotics、Apptronik、Fourier Intelligence 和 Unitree Robotics 的机器人。向记者介绍 GR00T 的迪普·塔拉(Deepu Talla)指出,该项目利用了生成式人工智能和转换器方面的最新研究成果,但没有分享其全部能力的更多细节。
值得注意的是,生成式人工智能领域的佼佼者 OpenAI 也在研究具身人工智能,并已经支持了该领域的两家初创公司:1X Technologies 和 Figure。就在最近,Figure 还发布了一段视频,展示了其一款机器人利用由山姆·阿尔特曼(Sam Altman)领导的研究实验室训练的强大视觉语言模型(VLM)完成日常家务的场景,比如捡拾垃圾。这两家公司均已确认与英伟达有合作关系。
塔拉表示,该公司目前无法分享有关内部架构的更多细节,但未来会分享更多关于能力方面的信息。他还指出,目前只有包括上述公司在内的少数类人机器人开发者能够提前访问该模型,但他们计划很快将其提供给更多的类人机器人和其他具身形态。
为确保类人机器人能够运行像 GR00T 这样的复杂多模态模型,英伟达还推出了针对类人机器人的 Jetson Thor 计算平台。该平台基于英伟达的 Thor SoC,包括高性能 CPU 集群和基于英伟达 Blackwell 架构的下一代 GPU,其中包含一个转换器引擎,可提供 800 teraflops 的 8 位浮点人工智能性能。
塔拉在介绍中表示,该系统的 GPU 性能是上一代产品 Jetson Orin 的 8 倍,而 CPU 性能则提高了 2.6 倍。
GR00T 核心的新 Isaac 机器人工具
为了让 Project GR00T 得以实现,英伟达利用了自己的 Isaac 机器人平台,为开发者提供了一个强大且端到端的平台,用于开发、模拟和部署 AI 驱动的机器人。
具体来说,该公司表示,它利用了基于 Isaac Sim 的全新 Isaac Lab,通过 GPU 加速的虚拟环境中的并行模拟来测试和训练模型,同时利用 OSMO 计算编排服务在英伟达 DGX 和英伟达 OVX 上并发管理训练和模拟工作负载。
除了这些功能外,Isaac 机器人平台还推出了两个针对特定用例的产品——Isaac Manipulator 和 Isaac Perceptor。
塔拉解释说,Isaac Manipulator 提供了 GPU 加速的库和专用基础模型,帮助机器人手臂制造商利用最先进的运动和灵巧性改进其产品。它包括用于检测物体、估计其 6D 位姿、跟踪它们,甚至进行密集预测以抓取它们的模型。
另一方面,Perceptor 负责通过基于 AI 的加速算法为 3D 感知和环绕视觉提供多摄像头、360 度视觉能力,从而引导机器人在非结构化环境中导航。英伟达通过其 Nova Orin DevKit 提供这项技术,并已经与包括 ArcBest、BYD 和 KION Group 在内的多个合作伙伴合作,帮助他们推进制造和履行领域的自主移动机器人功能。
ArcBest 的首席创新官兼 ArcBest Technologies 总裁迈克尔·纽西蒂(Michael Newcity)在一份声明中表示:“在我们的 Vaux Smart Autonomy AMR 叉车和堆高机中使用 Isaac Perceptor 平台,可以实现更好的感知、语义感知导航和 3D 映射,从而在仓库、配送中心和制造设施中的物料处理过程中检测障碍物。”
新的 Isaac 平台功能预计将于今年第二季度推出,而 Project GR00T 仍处于早期访问阶段。英伟达正在接受申请,以便让更多类人机器人开发者获得该技术的访问权限,但目前尚不清楚更广泛的公众发布时间表。