谷歌推出了其新的Google AI SDK,以简化在Android应用中整合其迄今为止性能最好的模型Gemini Pro。使用这个SDK,开发者无需构建和管理自己的后端基础设施。
谷歌宣称,Gemini Pro是其最佳模型,具备用于多种文本和图像推理任务的特性。Gemini Pro在设备外运行,在谷歌的数据中心,并可以通过Gemini API进行访问。谷歌表示,使用Gemini最简单的方式是通过Google AI Studio,这是一个基于网络的工具,可以使开发者在浏览器中原型化和运行提示。一旦你的结果令人满意,你可以将你的模型导出为代码,并使用你偏好的语言(例如Python)在后端运行。
对于Android应用,谷歌提供了适用于Android的Google AI客户端SDK,它将Gemini REST API包装成惯用的Kotlin API。使用它,开发者不需要直接与REST API打交道,也不需要实现服务器端服务来在Android应用中访问Gemini模型。
以下代码片段展示了如何使用Google AI SDK从仅文本提示生成文本:
val generativeModel = GenerativeModel(
modelName = "gemini-pro",
apiKey = BuildConfig.apiKey
)
val prompt = "Write a story about a magic backpack."
val response = generativeModel.generateContent(prompt)
print(response.text)
除了仅文本模型,Gemini还提供了一个多模态模型,能够从文本和图像输入生成文本,并支持流式处理,以加快交互速度。如下所示:
gemini-pro-vision
generateContentStream
generateContent
var fullResponse = ""
generativeModel.generateContentStream(inputContent).collect { chunk ->
print(chunk.text)
fullResponse += chunk.text
}
为了进一步简化开发者的工作流程,Android Studio的最新预览版引入了一个新的项目模板,将引导开发者完成使用Gemini Pro所需的步骤,从在Google AI Studio生成API密钥开始。
除了Gemini Pro之外,谷歌还提供了一个更小的模型,Gemini Nano,它可以在设备上运行。这使得应用可以在不需要数据离开设备的情况下运行,并确保即使在没有网络的情况下也有可预测的延迟。Gemini Nano在选定的设备上可用,通过AICore这是一个为Android 14设计的新系统服务,旨在简化在Android应用中整合AI,它负责模型管理、运行时、安全等更多内容。