机器人初创企业Physical Intelligence近日宣布,公司已成功筹集4亿美元新资金,专注于研发实用的人工智能模型,旨在为机器人打造“大脑”。此轮融资由亚马逊创始人兼执行董事长杰夫·贝佐斯、Thrive Capital和Lux Capital共同领投。参与本轮投资的其他机构还包括知名人工智能公司OpenAI、Redpoint Ventures和Bond。融资后,Physical Intelligence的估值达到约24亿美元。此前,该公司已在今年3月完成了一轮7000万美元的种子轮融资,由Thrive Capital主导。
Physical Intelligence由前谷歌机器人科学家卡罗尔·豪斯曼共同创立并担任首席执行官,其团队还包括来自加州大学伯克利分校和斯坦福大学的研究人员。该公司致力于开发一种适用于各类机器人的通用人工智能模型,使机器人能够理解物理世界,从而完成复杂的多任务操作。
豪斯曼在接受采访时表示,公司所研发的不只是针对特定机器人的大脑,而是一个能够控制任何机器人的通用型大脑。
据Physical Intelligence介绍,目前的机器人大多为专业型,大多数工业机器人只能执行单一任务或一系列简化动作。这些机器人虽能在环境发生小幅变化时继续工作,但难以适应杂乱或复杂的真实环境,如家庭或其他现实场所。
Physical Intelligence在上周的一篇博客文章中表示,人工智能有望改变这一现状,使机器人能够学习和遵循用户指令。用户只需告诉机器人想要完成什么任务,机器人就能自行调整其行为以适应环境。
为实现这一目标,Physical Intelligence开发了一种名为π0(或pi-zero)的人工智能模型,这是一种通用型机器人基础模型。用户只需简单地向机器人发出指令,就能让其执行任务,就像与大型语言模型聊天助手对话一样。与大型语言模型不同,pi-zero需要处理来自文本、图像、视频以及“物理智能”(即肢体移动、抓取和操作物体的实际体验)等多种类型的数据。
利用pi-zero,Physical Intelligence已展示出机器人在折叠衣物、制作咖啡、收拾餐桌和组装盒子等任务中的精细调整能力。例如,在收拾餐桌时,机器人需要区分垃圾和餐具,将垃圾扔进垃圾桶,将餐具放入托盘。它还需要学会在将餐具放入托盘前抖掉垃圾。
公司表示,目前创建通用型模型面临的最大挑战是缺乏大规模的多任务和多机器人数据。随着数据集的增长,这将为开发更强大、更灵活的机器人大脑提供基础。
Physical Intelligence指出,尽管已取得一定进展,但通用型机器人模型仍处于起步阶段。与大型语言模型是语言领域的基础模型一样,通用型机器人模型为物理智能提供了基础人工智能。
目前,市场上还存在其他类似的机器人控制基础模型,如拥有70亿参数的开源模型OpenVLA,常被学术研究人员用于实验,以及拥有930亿参数的Octo模型。Physical Intelligence表示,其pi-zero在大多数复杂任务上的表现优于OpenVLA和Octo。
为机器人配备“大脑”已成为科技行业的长期趋势。去年,谷歌研究人员展示了一款使用5.62亿参数模型PaLM-E的机器人,能够理解基本的单一语音指令,如拾取和传递物体。今年早些时候,英伟达公司也宣布了Project GR00T项目,旨在为双足人形机器人开发一种通用型基础模型。
Physical Intelligence表示,要实现这一愿景,不仅需要更多的数据,还需要整个机器人社区的共同努力。公司已与多家公司和机器人实验室建立合作关系,共同改进硬件设计,并利用合作伙伴的数据来训练预训练模型。