今日,字节跳动旗下的豆包大模型迎来了全新升级,1.5 Pro版本正式面世。此次发布的Doubao-1.5-pro模型在知识、代码、推理、中文等多个关键测评基准上表现出色,综合得分甚至超越了GPT-4o、Claude 3.5 Sonnet等业内知名模型,彰显了字节跳动在人工智能领域的深厚实力。
目前,Doubao-1.5-pro已在豆包App中开启灰度测试,供部分用户率先体验。同时,为了方便开发者接入,该模型也已在火山引擎平台开放API接口,供开发者直接调用。
据字节跳动官方透露,豆包大模型1.5 Pro采用了创新的预训练策略,通过较小的激活参数进行高效训练,并结合大规模稀疏MoE架构,实现了等效7倍激活参数的Dense模型性能。这一突破性的设计不仅提升了模型的性能,还大幅提高了MoE架构的杠杆效率,远超业内常规水平约3倍。
除了Doubao-1.5-pro之外,字节跳动还同步发布了新版豆包视觉理解模型Doubao-1.5-vision-pro和豆包实时语音模型Doubao-1.5-realtime-voice-pro。
Doubao-1.5-vision-pro在多模态数据合成、动态分辨率、多模态对齐、混合训练等多个方面进行了全面升级,进一步增强了模型的视觉推理能力、文字文档识别精度、细粒度信息理解能力以及指令遵循能力。同时,该模型的回复模式也变得更加精简和友好,为用户提供了更加流畅和自然的交互体验。
豆包大模型1.5 Pro还首次推出了豆包实时语音模型,并在豆包App中全量开放(需升级至7.2.0版本)。这款模型集成了语音理解和生成两大功能,实现了端到端的语音对话功能,具有低时延、可随时打断等优秀特性。据悉,火山引擎也将在上半年通过方舟平台推出对应的API服务,为更多开发者提供便捷的接入方式。
此外,字节跳动官方还强调,豆包大模型1.5 Pro在训练过程中未使用任何其他模型生成的数据,确保了模型的独立性和原创性。同时,豆包大模型1.5全系列产品,包括Doubao-1.5-pro、Doubao-1.5-lite、Doubao-1.5-vision-pro等,都将继续保持原有模型价格不变,实现了加量不加价的承诺。
此次豆包大模型1.5 Pro的发布,不仅标志着字节跳动在人工智能领域取得了新的突破,也为广大用户带来了更加智能、便捷的使用体验。未来,字节跳动将继续深耕人工智能领域,不断推出更多创新产品和技术,为行业发展贡献力量。