谷歌近日正式发布了Gemini 1.5 Flash和1.5 Pro模型的稳定版本,同时更新了一系列API并优化了Google AI Studio平台。这些更新旨在帮助开发者们以更高效、更具成本效益的方式大规模构建和部署AI应用。
一个显著的特点是,Gemini 1.5 Flash的速率限制得到了大幅提升,现支持每分钟高达1000个请求(RPM),且不再设置每日请求上限。这一改动是谷歌对开发者们需求的积极回应,旨在减少高量任务中的延迟和成本。尽管1.5 Pro的速率限制目前保持不变,但谷歌鼓励有更高需求或建议的开发者与他们联系。
自6月17日起,Gemini 1.5 Flash将新增模型调优功能,使开发者能够为生产环境定制模型,以获取更佳性能。这一调优功能将在Google AI Studio和Gemini API中提供,且当前调优作业不收取费用,使用调优模型也不产生额外的按令牌计费。
为了方便开发者解锁更高的API速率限制,他们现在可以在Google AI Studio中设置计费账户。关于Gemini 1.5模型的定价详情,可查阅Google AI定价页面。如果在计费设置过程中遇到任何问题,开发者可在开发者论坛上寻求帮助。对于企业级需求的用户,这些模型也可通过Vertex AI(谷歌的企业级AI平台)进行访问。
最后,谷歌还引入了JSON模式功能,使开发者能够为模型响应指定所需的JSON模式。这一功能将为那些需要模型遵循特定输出限制(如遵循预定义结构或仅输出特定文本)的用例开辟新的可能性。