似乎游戏是实现AGI的终极途径。OpenAI在创建ChatGPT的生成式人工智能热潮后,计划通过进入模拟世界来实现其达到AGI的终极目标。出于同样的目的,OpenAI最近收购了总部位于纽约的初创公司Global Illumination,该公司一直利用人工智能构建创意工具、基础设施和数字体验。
Global Illumination的团队曾在Instagram和Facebook早期设计和构建产品,并在YouTube、Google、皮克斯、Riot Games等其他知名公司做出重要贡献。Global Illumination的创始人目前正在开发名为Biomes的开源沙盒MMORPG游戏,该游戏面向Web构建,允许用户直接从浏览器构建、采集资源和玩迷你游戏,类似于Microsoft的Minecraft。
收购Global Illumination对于OpenAI来说至关重要。ChatGPT目前面临的挑战,包括用户保留问题,促使该组织寻求解决方案。此外,获得足够的训练数据一直是一项挑战。OpenAI意识到解决这些挑战的方法存在于游戏和强化学习领域。
这个开源的Minecraft克隆游戏为OpenAI提供了广泛收集人机交互数据的绝佳机会。这些数据无疑对推进他们的AGI系统的研究和开发具有极大的价值。
同时,这款游戏也是测试人工智能系统的理想平台,让OpenAI能够观察和分析在复杂的游戏环境中可能出现的有趣行为。
其中一位用户表达了相同的观点,并提到如果OpenAI能够创建一个游戏,其中代理和人类相互交互并追求各自开放性的目标,那将为构建AGI提供一个真实的数据集。这意味着模拟真实的互动可以在发展AGI方面提供很大帮助。
ChatGPT将永远无法获得比谷歌已经拥有的更好的问题-答案数据。如果OpenAI能够构建一个成功的游戏,其中代理和人类彼此交互以实现各自的开放性目标,那将是一个真实的用于构建AGI的数据集。
——NirSD(@nirsd)2023年8月16日
OpenAI不是第一个尝试创建基于生成式人工智能的模拟世界的机构。此前,斯坦福大学和谷歌的研究人员开源了斯坦福的Smallville。
在这个模拟世界中,25个人工智能代理模仿人类的生活,它们可以相互独立地进行交互,并具有独立思考的能力。这些代理人生活在一个数字化的Westworld中,他们对自己生活在模拟环境中毫不知情。他们上班工作、闲谈聊天、组织社交活动、结交新朋友,甚至谈恋爱,每个代理人都有独特的个性和背景故事。
受到斯坦福的Smallville的启发,风险投资公司a16z开源了名为“AI Town”的JS入门套件,该套件处理全局状态和多代理交易,帮助用户构建自己的小型AI文明。
这与DeepMind和Meta类似
在游戏中使用强化学习的策略最早由DeepMind(现在是Google DeepMind)采用。他们相信要达到AGI,强化学习是终极工具。因此,他们发表了一篇名为“奖励就足够”的论文,其中作者建议奖励最大化和试错经验足以开发出具有与AGI相关能力的行为。
Google DeepMind使用强化学习算法创建了能够在最具挑战性的象棋等游戏中击败人类的神经网络。2015年10月,AlphaGo成为首个击败职业人类棋手的计算机程序。
2017年底,它推出了AlphaZero,一个单一系统,可以自学习如何精通国际象棋、将棋和围棋,分别在每种情况下击败了世界冠军计算机程序。Google开发了一种深度强化学习算法,通过自我对弈游戏来学习价值网络(预测胜者)和策略网络(选择动作)。
Meta还尝试通过游戏训练其AI代理。在2022年,Meta AI创建的第一个AI代理CICERO在复杂的自然语言策略游戏《Diplomacy》中实现了与人类水平相当的表现。CICERO通过与人类在在线游戏平台webDiplomacy.net上对战证明了这一点,在一场以上的比赛中,它的得分超过了人类玩家的平均得分,并在参与比赛的人员中排名前10%。
从模拟到现实
OpenAI正在探索一切可能的方式来实现AGI。从从互联网上抓取数据到与AP等新闻机构合作,他们不遗余力。很可能在创建模拟世界之后,OpenAI将回归到现实世界,创建能够以自然方式与人类进行交互的人形机器人。
今年早些时候,OpenAI投资了挪威的机器人初创公司1x。该公司之前被称为Halodi Robotics,其构建能够实现人类般运动和行为的人形机器人。通过收购Global Illumination,OpenAI可以将模拟学习的所有经验应用于现实,并构建完美的人形机器人。
有趣的是,OpenAI并不是唯一一个认为世界需要物理机器人的公司。最近,Google DeepMind推出了RT-2,这是第一个可以在真实世界准确看见、理解语言并执行任务的视觉-语言-行动(VLA)模型。
去年,得到OpenAI早期投资者埃隆·马斯克支持的自动驾驶汽车公司特斯拉推出了一款名为Optimus的概念型人形机器人,用于通用应用。
总结
总的来说,OpenAI的代表们曾说“文本是世界的投影”,而现在他们明显在改变策略,向Google DeepMind的AGI战略借鉴了一些方法。有趣的是,Sam Altman或其他董事会成员对他们最近收购Global Illumination的事情没有发表一句话。