谷歌在上周发布了面向消费者的Gemini后,本周又为开发者和企业带来了Gemini Pro,这是一个通过AI Studio和Vertex AI提供的强大的AI服务。
Gemini Pro的第一个版本支持文本输入/输出,拥有32K的上下文窗口,谷歌表示将来会增加这个数字。此外,还有一个Gemini Pro Vision的端点,它可以同时处理文本和图像输入,输出文本。谷歌还介绍了Gemini Pro的一些特点:
Gemini Pro和Gemini Pro Vision今天可以通过谷歌AI Studio(原名MakerSuite)免费使用。这是一个基于网络的工具,面向个人开发者和团队,它“让你可以快速开发提示,然后获取一个用于应用开发的API密钥。”你可以用你的谷歌账户登录,并且可以快速从谷歌云端硬盘导入文件。
“获取代码”按钮让你可以把你的工作转移到你的IDE中,支持cURL、JavaScript、Python、Android(Kotlin)和Swift。
今天的发布提供了一个“免费配额”,每分钟允许60个请求,谷歌说这是“其他免费产品的20倍。”谷歌将使用这些免费的输入/输出来帮助改进模型,数据将与你的谷歌账户和API密钥脱敏。它“可能会被训练过的审阅者访问。”
谷歌云的Vertex AI是一个更高级的产品,它提供了更多的控制和集成。作为一个“完全托管的AI平台”,你可以使用自己的数据,构建基于Gemini的搜索/对话代理。此外,谷歌不会在来自谷歌云客户的输入或输出上训练“模型。
Gemini在Vertex AI中的访问将在明年初进入正式版之前免费。
届时,谷歌AI Studio和Vertex AI的定价将是每1K字符的输入0.00025美元,每张图像的输入0.00025美元,输出的成本是每1K字符0.0005美元。谷歌将其高效的TPU归功于这些价格。
展望未来,谷歌计划将Gemini带到其其他开发工具中,包括Android Studio、Colab、Firebase和Flutter。在消费者方面,该公司透露,Gemini将在2024年初登陆Duet AI for Workspace。
谷歌今天还宣布了Imagen 2,它具有“显著提高的图像质量”,以及以下特点: