CyberRunner AI是一台通过模块化学习过程来学习的机器人。它逐步储存之前所犯错误与成功的‘记忆’。
挑战的内容是将一个小球从迷宫的一个部分移动到终点,同时要避开游戏板上存在的陷阱和死胡同。
瑞士苏黎世联邦理工学院的研究者们本周发布了比赛视频,并公开了他们新的模块化学习创造。
发动机与肌肉
这个AI机器人通过两个小型马达模拟手的使用,并利用一个摄像头来代表机器人的眼睛。
在CyberRunner发布的视频中,我们看到机器人与其他人类竞争者同样只有6小时的时间来练习这个游戏。
模块化学习
CyberRunner的网站解释说:“机器人在游戏过程中不会停下来进行学习;算法在机器人运行游戏的同时并行运行。因此,机器人在每一次运行后都会变得更好。”
这些‘记忆’使得CyberRunner完成了迷宫测验,并创下了超越人类最快时间的记录。有趣的是,研究者表示AI机器人还开发出了“捷径”。
负责该机器人的公司表示:“收集到的经验会保存在记忆中。使用这个记忆,基于模型的强化学习算法可以学习系统的行为方式。”