最近,Khosla Ventures的创始人维诺德·科斯拉(Vinod Khosla)和OpenAI的初始投资者强调了为什么机器人技术将很快迎来其AI突破。
科斯拉表示,AI的变革性能力预示着未来AI和机器人技术将解放人类,使他们摆脱繁琐的任务。
他说,机器人将在未来2-5年内迎来一个“GPT时刻”,届时机器人将从被编程(遵循指令)转变为学习系统,理解物理和现实世界的动态,从而使机器人技术取得迅速进步。
已经在发生了
几天前,NVIDIA的研究人员推出了DrEureka,这是一款由大型语言模型(LLM)驱动的代理,可以自动化模拟到现实的流程,无需微调即可轻松训练一只机器狗在瑜伽球上保持平衡。
有趣的是,DrEureka是在其先前的工作Eureka的基础上构建的,Eureka是一种算法,可以教一个五指机器人手进行笔旋转。“这在我们用AI代理系统自动化整个机器人学习流程的追求中又迈出了一步,”Embodied AI(GEAR Lab)的高级研究经理兼负责人Jim Fan表示。
由OpenAI驱动的Figure 01在视觉推理能力方面也取得了显著进步。最近,它能够区分像橙子这样的健康选项和像薯片这样的不太理想的选择,其内部训练的神经网络以每秒10次的快速速率将相机输入映射到机器人行动上。
FigureAI机器人的创始人布雷特·阿德科克(Brett Adcock)认为,“未来每个人都会拥有一台机器人,就像今天拥有汽车或手机一样”,他补充道。
特斯拉也没有落后。最近,Optimus已经准备好在工厂中工作,利用FSD(完全自动驾驶)计算机实时对电池单元进行分类。它能够以最小的插入公差精确地对电池单元进行分类,并自动定位下一个可用的插槽。
今年起,谷歌DeepMind也发布了三个机器人研究系统——AutoRT、SARA-RT和RT-Trajectory,这些系统将帮助机器人更快地做出决策,更好地理解和导航它们的环境。这些模型将有助于数据收集、速度和泛化。
此外,斯坦福大学推出了Mobile ALOHA系统,该系统旨在复制需要全身控制的双手移动操作任务。
谷歌DeepMind支持了该项目,该技术解决了从人类演示中进行传统模仿学习的局限性。这些通用机器人被证明可以协助完成各种任务,如烹饪、清洁、举重和其他手工活动。
接下来是什么?
虽然人工智能研究的进步仍然很常见,但各大公司都在竞相寻求机器人技术的下一个重大突破。就像英伟达(NVIDIA)一个月前发布了GR00T项目,随后又发布了Dr Eureka一样,如前文所述,更多的公司也在机器人技术上投入了大量资金。
像谷歌DeepMind、特斯拉和英伟达这样的主要参与者都将机器人技术作为优先事项,因此重大突破可能会很快出现。在开源研究方面也取得了显著进展,Hugging Face在几天前推出了LeRobot,这是一个开源机器人数据库。
正如英伟达CEO黄仁勋正确地指出的那样,“对于全球领先的机器人专家来说,各种赋能技术正在融合,以推动人工智能通用机器人技术取得巨大飞跃。”
显然,机器人技术的ChatGPT时刻不在未来,而是已经到来!