据NeoTech报道,谷歌公司在其AI模型研发领域再次迈出重要一步,即将正式商用其最新研发的 Gemini 1.5 Flash 8B模型。这款模型是谷歌此前推出的三款Gemini实验性模型之一,以其小巧的体积和强大的多模态任务处理能力而备受瞩目。
Gemini 1.5 Flash 8B作为Gemini 1.5 Flash的精简版,拥有80亿参数,专为处理大容量任务和长文本摘要等复杂任务而设计。相较于原版模型,Gemini 1.5 Flash 8B在延迟方面有了显著提升,更适合用于聊天、转录和长文本翻译等实时性要求较高的应用场景。
除了性能上的优化,Gemini 1.5 Flash 8B另一大亮点在于其亲民的价格策略。据谷歌公司透露,该模型的计费标准将于10月14日(星期一)正式生效。具体费用如下:在低于128K上下文窗口下,每百万tokens输入提示词费用为0.0375美元(约合0.26元人民币),每百万tokens输出提示词费用为0.15美元(约合1.1元人民币),而每百万tokens缓存提示词费用更是低至0.01美元(约合0.071元人民币)。
这一价格策略无疑为广大开发者和企业用户提供了更为经济实惠的选择。作为对比,Gemini 1.5 Flash 模型的每百万输出tokens成本为0.3美元,该价格自2024年8月12日起实施。由此可见,新版Gemini 1.5 Flash 8B在价格上相较于原版实现了大幅降低,性价比显著提升。
此次谷歌公司推出Gemini 1.5 Flash 8B模型商用,不仅展示了其在AI技术研发领域的深厚实力,也为广大用户提供了更加高效、经济的AI解决方案。未来,随着该模型在商业领域的广泛应用,我们有理由相信,它将在推动AI技术普及和发展方面发挥重要作用。