谷歌发布Gemini 2.0 Flash，AI性能再升级

2024年12月12日由 daydream 发表 613 0

谷歌在其Gemini模型家族发布一年后，正式推出了Gemini 2.0系列的首款模型——Gemini 2.0 Flash。该模型在性能、多模态能力以及开发者友好特性上均实现了显著提升，树立了新的标杆。

微信截图_20241212094805

Gemini 2.0 Flash在速度上较前代模型提升了一倍，甚至超越了Gemini 1.5 Pro的表现。它支持实时文本、图像和音频输出，为开发者提供了更多样化的应用可能。其中，多模态实时API允许开发者构建具备实时音视频流功能的动态应用程序，进一步丰富了应用的交互方式。

此外，该模型还集成了谷歌搜索和代码执行等内置工具，提升了开发效率和便捷性。谷歌通过发布Gemini 2.0 Flash，再次彰显了其在人工智能领域的雄心壮志，同时也标志着其基础模型家族的重大升级。

在保持快速响应的同时，Gemini 2.0 Flash在速度和功能上都取得了显著进步。谷歌公布的基准测试结果显示，该模型在通用知识、编码、高级推理和多模态应用等方面均表现出色。

值得注意的是，Gemini 2.0 Flash引入了多项新功能，以满足开发者构建AI应用的需求。其中包括多语言原生音频输出，能够生成高质量、可操控的多种语言语音，且口音可根据用户偏好定制。原生内联图像输出功能则允许文本与图像无缝结合，适用于教程或社交媒体内容等应用。

多模态实时API是该模型的另一大亮点，它支持自然交互模式的实时对话，类似于谷歌Project Astra和ChatGPT的高级语音模式。此外，该模型还支持代码执行、谷歌搜索查询和自定义用户定义函数等任务。

目前，Gemini 2.0 Flash已通过谷歌AI Studio和Vertex AI中的Gemini API以实验性模型的形式提供。开发者可以立即访问多模态输入和文本输出功能，而文本转语音和原生图像生成功能则向早期访问合作伙伴开放。预计该模型将于1月正式全面推出，并附带更多型号选择。

随着谷歌AI开发者生态系统的不断发展，已有数百万开发者使用其AI工具构建应用，涵盖109种语言。这一增长趋势反映了市场对高效、强大且易于集成的AI模型的需求日益增加。

早期访问合作伙伴已经开始利用Gemini 2.0 Flash的新功能开发应用。例如，tldraw、Viggle和Toonsutra等公司正在开发从视觉游乐场到多语言翻译服务等不同领域的应用，展示了该模型的广泛应用潜力。

自8月以来，谷歌Flash模型的使用量增长了900%以上，这表明市场对谷歌模型及其AI开发和部署方法的认可度正在迅速提升。

文章来源：https://www.maginative.com/article/google-unveils-gemini-2-0-flash-with-major-speed-and-performance-upgrades/

标签：

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 DeepSeek AI发布新版模型，实现人工智能领域重大突破

下一篇微软发布Phi系列最新生成式AI模型Phi-4

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来

每个人都应该知道的48个AI术语

openwebtext glue shunk031/JGLUE piqa wikitext sciq EleutherAI/lambada_openai facebook/flores

AI热点

行业学习机器学习人工智能公司板人工智能未来机器人视觉识别

AI工具

更多工具 »

火山写作

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub Copilot

GitHub AI编程工具

Adobe Firefly

Adobe最新推出的AI图片生成工具

文心一格

AI艺术和创意辅助平台

本周热门

热门企业

热门职位

Maluuba

20000~40000/月

Unity技术经理

Cisco

25000~30000/月深圳市

高级数据分析工程师

PilotAILabs

30000~60000/年深圳市