Facebook的HanabiAI取得了最先进的成果
2019年12月09日 由 KING 发表
597437
0
Facebook AI 部门表示,它创造了最新的AI,可以在玩纸牌游戏Hanabi时达到最先进的性能。人工智能系统在25分制中的得分为24.61分,而之前的最好的系统得分为23.92分。
与人工智能挑战的国际象棋或围棋之类的游戏不同,Hanabi是一种合作游戏,参与者可以共同努力以实现一个共同的目标。
Facebook AI研究员Noam Brown在电话采访中说:“我们看到的结果远远超出了我们或其他研究人员的预期。实际上,我们从搜索中获得的收益要强于过去使用的所有深度强化学习算法所获得的收益。 ”Facebook的Hanabi AI借鉴了Pluribus的一些搜索技术,Pluribus是Facebook于今年早些时候推出的一款玩扑克的AI,击败了一些人类冠军。Facebook的AI团队通过结合深度强化学习应用搜索技术实现了这一壮举。搜索算法通过使除一个代理之外的所有代理执行商定的策略将问题转换为单个代理设置,这是一种称为蓝图的强化学习算法。根据题为“部分通过合作中的搜索改进策略” 的论文,该蓝图允许搜索代理“将其他代理的已知策略作为环境的一部分进行处理,并基于其他行为来维护对隐藏信息的信念”。
布朗说,最终,Facebook研究人员认为,类似于其Hanabi机器人的AI可以帮助机器人系统,自动驾驶车辆或对话式AI代理通过解决“心理理论”挑战来更好地响应人类活动。心智理论就像是让自己穿上另一个人的鞋子来推断他们下一步行动的想法。例如您在开车并且前方的汽车停下来,您可能会推断出某个人在走向人行横道,即使你还看不见这个人。布朗说:“这是人类非常自然的事情,这种想法是能够让自己陷入另一个人的脚下,并理解他们为什么要采取他们正在采取的行动,他们在想什么,即使他们没有采取行动。不知道某些事情。但这是AI历来真正挣扎的事情。关于灵长类动物是否具有心智论证以及人类婴儿在多大年龄发展心智论证一直存在着长期的争论,我认为最终在人工智能中看到这种行为真的很有趣。我认为,如果我们想在现实世界中部署AI与人类互动,那将非常重要,因为人类期望这种行为。