推理AI模型开发成本降低,开源模型Sky-T1发布

2025年01月13日 由 daydream 发表 3269 0

近日,来自加州大学伯克利分校天空计算实验室的研究团队NovaSky发布了一款名为Sky-T1-32B-Preview的推理模型。该模型在多个关键基准测试中与OpenAI早期版本的o1模型具有竞争力。值得注意的是,Sky-T1是首个真正意义上的开源推理模型,意味着其可以从零开始复制。NovaSky团队不仅公开了用于训练该模型的数据集,还提供了必要的训练代码。


微信截图_20250113091354


据团队透露,Sky-T1-32B-Preview的训练成本不到450美元,这显示了以经济实惠且高效的方式复制高级推理能力的可能性。尽管450美元对于许多人来说可能并不低廉,但与过去同类性能模型训练成本动辄数百万美元相比,这一数字已大幅下降。成本的降低部分得益于合成训练数据的使用,即由其他模型生成的数据。例如,AI公司Writer最近发布的Palmyra X 004模型几乎完全依赖于合成数据进行训练,据报道其开发成本仅为70万美元。


推理模型与其他AI模型的主要区别在于其自我事实核查的能力,这有助于避免一些常见错误。尽管推理模型在解决问题时可能需要比普通模型多花几秒钟到几分钟的时间,但它们在物理、科学和数学等领域往往更加可靠。


在开发Sky-T1的过程中,NovaSky团队首先使用阿里巴巴的QwQ-32B-Preview推理模型生成了初始训练数据,然后对数据进行筛选和优化,并利用OpenAI的GPT-4o-mini将数据重构为更易处理的格式。使用8个Nvidia H100 GPU组成的机架进行训练,Sky-T1的320亿参数模型耗时约19小时完成训练。


在性能表现上,Sky-T1在数学挑战赛MATH500中的表现优于o1的早期预览版,同时在编程评估平台LiveCodeBench的难题集上也击败了o1预览版。然而,在包含物理学、生物学和化学相关问题的GPQA-Diamond测试中,Sky-T1的表现不如o1预览版。此外,OpenAI正式发布的o1模型性能强于预览版,且预计将在未来几周内推出性能更佳的推理模型o3。


尽管如此,NovaSky团队表示,Sky-T1只是他们开发具有高级推理能力的开源模型的起点。未来,团队将致力于开发更高效且保持强大推理性能的模型,并探索进一步提升模型测试时效率和准确性的先进技术。

文章来源:https://techcrunch.com/2025/01/11/researchers-open-source-sky-t1-a-reasoning-ai-model-that-can-be-trained-for-less-than-450/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消