微软近日宣布,其Phi系列生成式人工智能模型家族迎来了新成员——Phi-4。据微软介绍,Phi-4在多个方面相较于其前身有所改进,特别是在数学问题解决能力上表现突出。这一进步部分得益于训练数据质量的提升。
Phi-4于周四晚间正式推出,但访问权限极为有限。目前,该模型仅可在微软新推出的Azure AI Foundry开发平台上使用,且仅限于在微软研究许可协议下的研究目的。
Phi-4是微软最新的小型语言模型,拥有140亿参数,与GPT-4o mini、Gemini 2.0 Flash和Claude 3.5 Haiku等小型模型展开竞争。这类AI模型通常运行速度更快、成本更低,近年来,小型语言模型的性能也在逐步提升。
微软表示,Phi-4性能的大幅提升得益于“高质量合成数据集”的使用,以及人类生成内容的高质量数据集和一些未具体说明的训练后改进方法。
当前,许多AI实验室正密切关注合成数据和训练后改进方面的创新。Scale AI首席执行官Alexandr Wang在周四的一条推特中表示,“我们已遭遇训练数据瓶颈”,这与此前几周内关于该话题的多篇报道相吻合。