在1月8日于拉斯维加斯举行的CES活动中,Meta公司首席人工智能科学家、图灵奖得主雅恩·勒康(Yann LeCun)对当前的人工通用智能(AGI)定义提出了批评,并指出仅仅依靠文本驱动的大规模语言模型(LLM)的持续扩展是远远不够的。
勒康对OpenAI首席执行官Sam Altman最近帖子中的言论表示了不同意见,Altman声称其团队已经掌握了构建AGI的方法,并正在向超越超级智能的目标迈进。勒康明确表示,尽管他更倾向于使用“人类水平智能”这一术语,但现有的大型语言模型还远远达不到这一水平。
他强调:“没有任何迹象表明,我们今天所了解的自回归LLM能够达到人类智能的水平。这是不可能的。”勒康指出,LLMs的工作原理是通过查看所有可能的文本来完成句子,并选择最佳文本,但人脑的功能远不止于此,它涉及各种感官的综合运用。
此外,勒康还提到,目前的人工智能系统大多属于“狭义人工智能”,只能在某些特定任务上表现出色,如下棋或医疗诊断。一旦条件稍有变化,这些系统就可能失效。他举例说:“人们常说,‘我们现在有了能在下棋上打败我们的系统,所以很快它们就会像我们一样聪明。’但实际上,我们已经有了可以开车穿越沙漠的系统,但13年过去了,我们仍然没有实现第5级的自动驾驶汽车。”
勒康进一步指出,即使通过组装各种系统,我们能够创造出能够完成很多事情的系统,但这并不意味着它们就具备了人类水平的智能。它们缺乏规划、推理以及理解物理世界的能力。他强调:“AI系统可能擅长认知任务,但它们无法执行像水暖工一样的物理任务。这需要对物理世界和物体的深刻理解和操控。”
勒康还提到,LLMs的性能一直通过扩展获得提升,包括对它们进行越来越大规模的数据训练。但现在,这种扩展的规律已经达到了收益递减的点,扩展已经饱和。即使继续通过扩展改善LLMs,也是“非常昂贵的”,这也是为什么尽管OpenAI每月向ChatGPT Pro收费200美元,但在这方面“并不赚钱”。
然而,勒康对于基于人工智能的机器人的未来还是看到了希望的曙光。他提到,生成世界模型的兴起为机器人提供了训练的虚拟环境,这相比在真实世界中训练机器人更具成本效益且风险更小。Nvidia首席执行官黄仁勋发布的Cosmos平台以及Google DeepMind组建的新团队都是这一趋势的体现。
当被问及类似于“ChatGPT时刻”的机器人何时会到来时,勒康表示,随着生成世界模型的出现,可能还需要三到五年的时间。但他也强调,尽管AI代理人可能会变得普遍,因为人们已经习惯了各种类型的AI助手帮助他们工作,但这些助手将是针对特定任务进行训练的机器人,而不是真正智能的、能够从头开始执行活动的AI助手。