字节跳动发布豆包视觉理解模型，并大幅降低应用成本

2024年12月19日由 neo 发表 445 0

在昨日盛大举行的火山引擎Force大会上，字节跳动公司震撼发布了其最新的豆包视觉理解模型，旨在为企业提供强大且经济实惠的多模态大模型能力。据悉，该模型在处理大量数据时展现出惊人效率，千tokens的输入成本仅为3厘，这意味着企业仅需支付1元钱即可处理高达284张720P分辨率的图片。字节跳动官方自豪地宣布，这一价格相较于行业平均水平降低了85%，为企业用户带来了前所未有的实惠。

QQ截图20241219171113

针对此次发布，抖音集团副总裁李亮于今日在社交媒体上发表了看法。他强调：“我们此举并非意在挑起价格战。豆包大模型之所以能够实现如此低廉的价格，关键在于其背后的技术创新。我们在算法、软件工程以及硬件方案上进行了大量的优化工作，使得3厘/千tokens的定价依然能够保持可观的利润空间。更重要的是，我们提供的是一步到位的透明价格策略，摒弃了行业内常见的‘刊例价+折扣’的复杂定价模式。我们的目标是推动AI技术的普及和应用发展，正如谭待所言：‘优秀的模型应当让每一家企业都能轻松负担得起。’”

此外，大会还见证了豆包3D生成模型的首次亮相。这款模型与火山引擎的数字孪生平台veOmniverse相结合，能够完成智能训练、数据合成以及数字资产制作等一系列复杂任务。字节跳动官方将其誉为“一套专为AIGC创作打造的物理世界仿真模拟器”，为数字内容的创作和生产带来了全新的可能性。

在豆包大模型家族的众多产品中，多款产品也迎来了重要的更新。其中，豆包通用模型pro已经全面对齐GPT-4的标准，但使用价格仅为后者的1/8，为用户提供了性价比极高的选择。音乐模型则新增了生成3分钟完整作品的能力，为音乐创作领域注入了新的活力。而文生图模型2.1版本则进一步提升了精准度，不仅能够生成汉字，还能实现一句话P图的功能，并已成功接入即梦AI和豆包App，为用户提供了更加便捷的创作工具。

文章来源：https://www.163.com/dy/article/JJP12AF20511DP7O.html

标签：

字节跳动豆包

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 NVIDIA发布具有增强型生成AI功能的新型迷你超级计算机

下一篇 OpenAI活动第十一弹：扩展ChatGPT桌面应用功能，新增多项应用集成

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来