DeepMind研究团队专注于人工智能下一个前沿——人工通用智能(AGI),但他们意识到,首先需要解决一个关键问题。他们问,AGI究竟是什么?
一般来说,AGI通常被视为一种人工智能,它具有理解、学习并将知识应用于广泛任务范围的能力,操作方式类似于人脑。维基百科将范围扩大,表明AGI是“一种假设性的智能代理,[它]可以学习完成人类或动物可以执行的任何智力任务。”
OpenAI的宪章将AGI描述为一套“在大多数具有经济价值的工作中胜过人类的高度自主系统”。
AI专家和Geometric Intelligence的创始人Gary Marcus将其定义为“任何灵活且普适的智能,具备和人类智能相媲美(或超过)的智能和可靠性。”
随着定义有这么多变化,DeepMind团队采纳了几个世纪前伏尔泰提出的一个简单观点:“如果你想和我对话,那么请先给你的用语下个定义。”
在预印本服务器arXiv上发表的一篇论文中,研究人员概述了他们所称的“用于分类AGI模型能力和行为的框架”。
通过这样做,他们希望为研究人员建立一种共同语言,以便在衡量进展、比较方法和评估风险时使用。
“实现人类水平的‘智能’是我们领域中许多人的隐藏的或明确的目标,”20年前引入AGI术语的Shane Legg说。
Legg解释说:“我看到许多讨论,人们似乎在用这个术语指代不同的东西,这导致了各种各样的混乱。现在AGI变得如此重要,我们需要明确它的定义。”
在名为“Levels of AGI: Operationalizing Progress on the Path to AGI,”的arXiv论文中,团队总结了AGI模型所需的几项原则。这些包括侧重于系统的能力,而非过程。
“实现AGI并不意味着系统‘思考’或‘理解’具备诸如意识或感知等属性,”团队强调。
AGI系统还必须有学习新任务的能力,并且知道何时寻求人类对任务的澄清或协助。
另一个参数是专注于潜力,而不必然是程序的实际部署。“将部署作为衡量AGI的条件引入了非技术障碍,例如法律和社会考虑因素,以及潜在的道德和安全问题,”研究人员解释说。
然后,该团队编制了一个从“0级,非AGI”到“5级,超人类”的智力门槛列表。1-4级包括“新兴”、“能干”、“专家”和“大师”。
三个程序达到了AGI标签的门槛。但这三个生成文本模型(ChatGPT、Bard和Llama 2)仅达到“1级,新兴”级别。没有其他当前的AI程序符合AGI的标准。
其他列为AI的程序包括SHRDLU,一种在麻省理工学院开发的早期自然语言理解计算机,列为“1级,新兴AI”。
位于“2级,能干”的有Siri、Alexa和Google Assistant。语法检查器Grammarly排在“3级,专家AI”。
在此列表更高位置的是“4级,大师”的Deep Blue和AlphaGo。名列榜首,“5级,超人类”的是DeepMind的AlphaFold,它预测蛋白质的3D结构是如何从其氨基酸序列中得出的;还有StockFish,一款强大的开源国际象棋程序。
然而,AGI并没有一个单独的定义,而且一直在变化。
“随着我们对这些基本过程的了解越来越深入,重新审视我们对AGI的定义可能很重要,”谷歌DeepMind的人类与AI互动首席科学家Meredith Ringel Morris说。
“我们不可能列举出一个足够通用的智能可实现的任务集,”研究人员说。“因此,AGI基准应该是一个灵活的基准。因此,这样的基准应该包括一个生成和商定新任务的框架。”