腾讯发布新一代快思考模型混元Turbo S

2025年02月28日由 daydream 发表 3604 0

腾讯近日正式推出了其新一代快思考模型——混元Turbo S。该模型与先前的Deepseek R1和混元T1等慢思考模型不同，具备即时响应的能力，能够实现“秒回”，并且吐字速度较之前提升了一倍，首字时延降低了44%。

微信截图_20250228095903

在知识、数理和创作等多个领域，混元Turbo S均展现出了良好的性能。研究指出，人类日常决策中的90%至95%依赖于直觉，而快思考模型正如人类的直觉一般，为大模型提供了在通用场景下的快速响应能力。与之相对的慢思考模型则更侧重于理性思维，通过逻辑拆解来提供解决问题的思路。

结合快思考与慢思考的优势，大模型能够更智能、高效地解决各种问题。混元Turbo S通过长短思维链的融合，在保持文科类问题快速响应的同时，还基于自研的混元T1慢思考模型合成的长思维链数据，显著提升了理科推理能力，实现了模型整体性能的显著提升。

在业界通用的多个公开基准测试中，混元Turbo S在知识、数学、推理等领域均展现出了与DeepSeek V3、GPT 4o、Claude等业界领先模型相当的效果。

在架构方面，混元Turbo S创新性地采用了Hybrid-Mamba-Transformer融合模式，有效降低了传统Transformer结构的计算复杂度，减少了KV-Cache缓存占用，进而降低了训练和推理成本。这一新融合模式不仅发挥了Mamba架构在处理长序列方面的高效性，还保留了Transformer在捕捉复杂上下文方面的优势，构建了显存与计算效率均优的混合架构。

值得一提的是，这也是工业界首次成功将Mamba架构无损地应用于超大型多专家混合模型（MoE）上。通过模型架构上的技术创新，混元Turbo S的部署成本大幅降低，有助于进一步降低大模型的应用门槛。

作为腾讯混元系列的旗舰模型，混元Turbo S将成为衍生模型的核心基座，为推理、长文、代码等衍生模型提供基础能力。基于混元Turbo S，腾讯还推出了具备深度思考能力的推理模型T1，该模型已在腾讯元宝平台面向所有用户开放。

目前，开发者和企业用户已经可以通过腾讯云的API调用混元Turbo S模型，并且即日起一周内可以免费试用。在定价方面，混元Turbo S的输入价格为每百万tokens 0.8元，输出价格为每百万tokens 2元，相较于前代模型价格大幅下降。腾讯元宝也将逐步灰度上线混元Turbo S，用户在元宝内选择“Hunyuan”模型并关闭深度思考功能即可体验使用。

文章来源：https://mp.weixin.qq.com/s/BwQkXpEitOm1Piz60SE-4A

标签：

腾讯模型 Turbo S

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 Inception Labs推出首款扩散式大型语言模型Mercury Coder

下一篇 Google开源AI模型SpeciesNet，助力野生动物图像分析

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来