字节跳动发布豆包视觉理解模型,并大幅降低应用成本

2024年12月19日 由 neo 发表 46 0

在昨日盛大举行的火山引擎Force大会上,字节跳动公司震撼发布了其最新的豆包视觉理解模型,旨在为企业提供强大且经济实惠的多模态大模型能力。据悉,该模型在处理大量数据时展现出惊人效率,千tokens的输入成本仅为3厘,这意味着企业仅需支付1元钱即可处理高达284张720P分辨率的图片。字节跳动官方自豪地宣布,这一价格相较于行业平均水平降低了85%,为企业用户带来了前所未有的实惠。

QQ截图20241219171113

针对此次发布,抖音集团副总裁李亮于今日在社交媒体上发表了看法。他强调:“我们此举并非意在挑起价格战。豆包大模型之所以能够实现如此低廉的价格,关键在于其背后的技术创新。我们在算法、软件工程以及硬件方案上进行了大量的优化工作,使得3厘/千tokens的定价依然能够保持可观的利润空间。更重要的是,我们提供的是一步到位的透明价格策略,摒弃了行业内常见的‘刊例价+折扣’的复杂定价模式。我们的目标是推动AI技术的普及和应用发展,正如谭待所言:‘优秀的模型应当让每一家企业都能轻松负担得起。’”

此外,大会还见证了豆包3D生成模型的首次亮相。这款模型与火山引擎的数字孪生平台veOmniverse相结合,能够完成智能训练、数据合成以及数字资产制作等一系列复杂任务。字节跳动官方将其誉为“一套专为AIGC创作打造的物理世界仿真模拟器”,为数字内容的创作和生产带来了全新的可能性。

在豆包大模型家族的众多产品中,多款产品也迎来了重要的更新。其中,豆包通用模型pro已经全面对齐GPT-4的标准,但使用价格仅为后者的1/8,为用户提供了性价比极高的选择。音乐模型则新增了生成3分钟完整作品的能力,为音乐创作领域注入了新的活力。而文生图模型2.1版本则进一步提升了精准度,不仅能够生成汉字,还能实现一句话P图的功能,并已成功接入即梦AI和豆包App,为用户提供了更加便捷的创作工具。

文章来源:https://www.163.com/dy/article/JJP12AF20511DP7O.html
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
写评论取消
回复取消