在牛仔竞技场上,我们见过勇敢的牛仔骑在公牛背上展现他们的技艺。但如今,在这科技的世界里,一只机器狗却能在瑜伽球上连续保持平衡并行走,这真是令人叹为观止!
观看这台四肢行走的设备移动和适应环境,不仅让人觉得有趣,更是凸显了这项技术的严肃性和巨大潜力。尤其是当我们意识到,像GPT-4这样的人工智能(AI)在训练机器人执行困难任务方面,似乎比人类更为高效。
而这一切的背后,是名为“DrEureka”的开源软件包。它利用大型语言模型(LLMs)如ChatGPT 4来训练机器人执行实际指令。
在“模拟到现实”的系统中,首先会在虚拟环境中模拟物理现象,然后才将这些技能应用到现实生活中。
开发者Jim Fan表示:“瑜伽球任务尤其具有挑战性,因为弹性球表面的模拟难度很大。但DrEureka在搜索大量模拟到现实的配置时毫无压力,使得机器狗能够在各种地形上操控球,甚至实现侧行行走!”
那么,LLM是如何训练机器人的呢?
在“DrEureka”中,“Dr”代表的是“领域随机化”(Domain randomization)。这意味着在模拟环境中,湿度、摩擦力、质量、重心等可变因素都会被随机化。
通过向LLM提供一系列指令,AI会处理这些信息,并编写出相应的代码。这些代码确定了一个奖励/惩罚系统,用以在虚拟环境中教导机器人。其中,0分代表失败,而任何高于零的分数都代表成功——分数越高,奖励越大。同时,还可以设置包括球的弹跳、驱动力和肢体运动在内的各种变量的最小和最大断点。
有了强大的LLM支持,为训练系统创建大量参数以同时执行命令变得轻而易举——这也正是机器狗能在瑜伽球上大展身手的秘诀所在。