谷歌DeepMind的首席执行官戴米斯·哈萨比斯(Demis Hassabis)预计,在不远的未来,人工智能系统将不再仅仅局限于回答问题,而是能够自主地进行规划和行动。
在接受采访时,哈萨比斯透露,他们正在开发这类“代理式”系统,并有望在接下来的一到两年内投入使用。
“我对这些大型通用模型的下一阶段非常期待。我相信接下来我们会看到更多像代理一样的行为,可能就在今年或明年。”哈萨比斯说道。
他进一步指出,这些系统不仅能够回答问题,还能在真实世界中自主规划和行动。哈萨比斯认为,这种设定和实现目标的能力将使这些系统在作为日常辅助工具时更加实用。
哈萨比斯坚信,这是使人工智能系统在日常生活中更加有用的关键一步。DeepMind可以借鉴其在强化学习方面的丰富经验,该技术已经在著名的围棋程序AlphaGo中得到了应用。
“我们正在努力,其他人也在努力。这让我们回想起几年前我们在游戏领域做的一些工作,都是代理系统,致力于实现某些目标和任务。我们现在正将这些工作与当前的大型多模态工作相结合。”哈萨比斯解释道。
行动与愿景
在2023年6月发布Gemini语言模型之前,哈萨比斯在接受《连线》杂志采访时暗示,DeepMind在强化学习方面的专长可能会让Gemini具备独特的优势。
借助AlphaGo的强化学习和树搜索技术,Gemini有望在未来展现出卓越的问题解决和规划能力。
哈萨比斯的这些评论表明,DeepMind正在稳步推进其AI系统的开发,以实现更高的自主性。
如果DeepMind成功研发出能在现实世界中独立解决复杂任务的AI代理,其影响将是深远的。这些系统的潜在应用非常广泛,包括智能个人助理、自主机器人以及在科学研究中担任自我学习系统的角色。
除了Gemini之外,DeepMind还在进行RT模型等项目,该项目利用大型AI模型进行图像和语言处理,使嵌入机器人的AI在日常生活中具备更强的行动能力。
DeepMind将语言模型与代理技术相结合的方法与OpenAI和Anthropic等公司相似。这些公司也在积极开发能够沟通和行动的AI代理。
OpenAI最近重返机器人领域,将其视觉语言模型与Figure公司的机器人技术相结合。
哈萨比斯坚信AI将造福人类
尽管有批评者警告说,大型AI模型在训练和推理过程中需要巨大的能源支持,并且随着模型规模的扩大,能源需求也在不断增加。
但哈萨比斯对此并不认同,他坚信投入AI的巨量资源最终将为人类带来丰厚的回报。
“从长远来看,我认为我们在药物发现等领域构建的生成式AI模型所带来的益处将远远超过这些成本。”哈萨比斯表示。
他还看到了AI在能源和气候等领域的潜在价值,比如通过更高效的电网、新材料和技术。他认为,这些技术可能会非常高效和有用,远远超过构建这些系统所需的成本和努力。
最终,哈萨比斯表示,他们的目标是让AI在尽可能多的领域得到应用。这样,AI的发展才可能是可持续的。