腾讯发布新一代快思考模型混元Turbo S

2025年02月28日 由 daydream 发表 3479 0

腾讯近日正式推出了其新一代快思考模型——混元Turbo S。该模型与先前的Deepseek R1和混元T1等慢思考模型不同,具备即时响应的能力,能够实现“秒回”,并且吐字速度较之前提升了一倍,首字时延降低了44%。


微信截图_20250228095903


在知识、数理和创作等多个领域,混元Turbo S均展现出了良好的性能。研究指出,人类日常决策中的90%至95%依赖于直觉,而快思考模型正如人类的直觉一般,为大模型提供了在通用场景下的快速响应能力。与之相对的慢思考模型则更侧重于理性思维,通过逻辑拆解来提供解决问题的思路。


结合快思考与慢思考的优势,大模型能够更智能、高效地解决各种问题。混元Turbo S通过长短思维链的融合,在保持文科类问题快速响应的同时,还基于自研的混元T1慢思考模型合成的长思维链数据,显著提升了理科推理能力,实现了模型整体性能的显著提升。


在业界通用的多个公开基准测试中,混元Turbo S在知识、数学、推理等领域均展现出了与DeepSeek V3、GPT 4o、Claude等业界领先模型相当的效果。


在架构方面,混元Turbo S创新性地采用了Hybrid-Mamba-Transformer融合模式,有效降低了传统Transformer结构的计算复杂度,减少了KV-Cache缓存占用,进而降低了训练和推理成本。这一新融合模式不仅发挥了Mamba架构在处理长序列方面的高效性,还保留了Transformer在捕捉复杂上下文方面的优势,构建了显存与计算效率均优的混合架构。


值得一提的是,这也是工业界首次成功将Mamba架构无损地应用于超大型多专家混合模型(MoE)上。通过模型架构上的技术创新,混元Turbo S的部署成本大幅降低,有助于进一步降低大模型的应用门槛。


作为腾讯混元系列的旗舰模型,混元Turbo S将成为衍生模型的核心基座,为推理、长文、代码等衍生模型提供基础能力。基于混元Turbo S,腾讯还推出了具备深度思考能力的推理模型T1,该模型已在腾讯元宝平台面向所有用户开放。


目前,开发者和企业用户已经可以通过腾讯云的API调用混元Turbo S模型,并且即日起一周内可以免费试用。在定价方面,混元Turbo S的输入价格为每百万tokens 0.8元,输出价格为每百万tokens 2元,相较于前代模型价格大幅下降。腾讯元宝也将逐步灰度上线混元Turbo S,用户在元宝内选择“Hunyuan”模型并关闭深度思考功能即可体验使用。

文章来源:https://mp.weixin.qq.com/s/BwQkXpEitOm1Piz60SE-4A
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消