近日,一则关于OpenAI最新推理模型o1的报道在AI界引起了广泛关注。据报道,该模型在推理过程中不仅会使用英文,还会“思考”中文、波斯语等多种语言,这一发现引发了业界内的诸多猜测和讨论。
网友@RishabJainK于1月9日在某社交平台发布了一条推文,透露了他在使用o1模型时的一个惊人发现。即使提示词中仅包含英文,o1在推理过程中也会涉及中文等其他语言。推文所附的截图展示了模型在“提议新创意”时,明显运用了多种语言进行思维。然而,对于这一奇特现象,OpenAI目前尚未给出任何解释或回应。
面对这一新发现,AI领域的专家们纷纷提出了自己的推测。Hugging Face的首席执行官Clément Delangue等专家认为,o1等推理模型的训练数据集中包含了大量的中文信息,这可能是导致模型在推理过程中使用中文的原因。他们认为,模型在训练过程中学习了多种语言的表达方式,从而在推理时能够灵活运用。
此外,Google DeepMind的研究员Ted Xiao也提出了自己的看法。他认为,OpenAI等公司在训练模型时可能使用了第三方的中文数据标注服务。因此,o1模型在推理过程中切换到中文,实际上是“中文语言对推理的影响”的一个具体体现。他强调,数据标注(标签)在帮助模型理解数据方面起着至关重要的作用。
与此同时,还有一些专家提出了另一种可能。他们认为,o1模型可能只是在使用其认为最有效的语言来解决所谓的“幻觉”等问题。阿尔伯塔大学的AI研究员Matthew Guzdial指出,对于模型来说,它并不了解语言的含义或语言之间的差异。所有文本在模型眼中都是相同的,模型只是通过处理token(词、音节或单个字符)来进行推理,而不是直接处理单词。