谷歌发布Gemini 2.0 Flash,AI性能再升级

2024年12月12日 由 daydream 发表 222 0

谷歌在其Gemini模型家族发布一年后,正式推出了Gemini 2.0系列的首款模型——Gemini 2.0 Flash。该模型在性能、多模态能力以及开发者友好特性上均实现了显著提升,树立了新的标杆。


微信截图_20241212094805


Gemini 2.0 Flash在速度上较前代模型提升了一倍,甚至超越了Gemini 1.5 Pro的表现。它支持实时文本、图像和音频输出,为开发者提供了更多样化的应用可能。其中,多模态实时API允许开发者构建具备实时音视频流功能的动态应用程序,进一步丰富了应用的交互方式。


此外,该模型还集成了谷歌搜索和代码执行等内置工具,提升了开发效率和便捷性。谷歌通过发布Gemini 2.0 Flash,再次彰显了其在人工智能领域的雄心壮志,同时也标志着其基础模型家族的重大升级。


在保持快速响应的同时,Gemini 2.0 Flash在速度和功能上都取得了显著进步。谷歌公布的基准测试结果显示,该模型在通用知识、编码、高级推理和多模态应用等方面均表现出色。


值得注意的是,Gemini 2.0 Flash引入了多项新功能,以满足开发者构建AI应用的需求。其中包括多语言原生音频输出,能够生成高质量、可操控的多种语言语音,且口音可根据用户偏好定制。原生内联图像输出功能则允许文本与图像无缝结合,适用于教程或社交媒体内容等应用。


多模态实时API是该模型的另一大亮点,它支持自然交互模式的实时对话,类似于谷歌Project Astra和ChatGPT的高级语音模式。此外,该模型还支持代码执行、谷歌搜索查询和自定义用户定义函数等任务。




目前,Gemini 2.0 Flash已通过谷歌AI Studio和Vertex AI中的Gemini API以实验性模型的形式提供。开发者可以立即访问多模态输入和文本输出功能,而文本转语音和原生图像生成功能则向早期访问合作伙伴开放。预计该模型将于1月正式全面推出,并附带更多型号选择。


随着谷歌AI开发者生态系统的不断发展,已有数百万开发者使用其AI工具构建应用,涵盖109种语言。这一增长趋势反映了市场对高效、强大且易于集成的AI模型的需求日益增加。


早期访问合作伙伴已经开始利用Gemini 2.0 Flash的新功能开发应用。例如,tldraw、Viggle和Toonsutra等公司正在开发从视觉游乐场到多语言翻译服务等不同领域的应用,展示了该模型的广泛应用潜力。


自8月以来,谷歌Flash模型的使用量增长了900%以上,这表明市场对谷歌模型及其AI开发和部署方法的认可度正在迅速提升。

文章来源:https://www.maginative.com/article/google-unveils-gemini-2-0-flash-with-major-speed-and-performance-upgrades/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消