谷歌周五在其 Gemini 开发者 API 中添加了一个全新的实验性文本“嵌入”模型 Gemini Embedding。
嵌入模型将文本输入(例如单词和短语)转换为数字表示形式(称为嵌入),以捕获文本的语义含义。嵌入用于各种应用,例如文档检索和分类,部分原因是它们可以降低成本并改善延迟。
亚马逊、Cohere 和 OpenAI 等公司都通过各自的 API 提供嵌入模型。谷歌之前也提供过嵌入模型,但 Gemini Embedding 是其首个在 Gemini 系列 AI 模型上进行训练的模型。
谷歌在一篇博客文章中表示: “该嵌入模型是在 Gemini 模型上进行训练的,它继承了 Gemini 对语言和细微语境的理解,使其适用于广泛的用途。” “我们已经将我们的模型训练得非常通用,在金融、科学、法律、搜索等不同领域都表现出色。”
Google 声称,Gemini Embedding 的性能超越了其之前最先进的嵌入模型 text-embedding-004,并在流行的嵌入基准上取得了具有竞争力的性能。与 text-embedding-004 相比,Gemini Embedding 还可以一次接受更大的文本和代码块,并且支持的语言数量是其两倍(超过 100 种)。
谷歌指出,Gemini Embedding 处于“实验阶段”,容量有限,可能会发生变化。该公司在其博客文章中写道:“我们正在努力在未来几个月内推出稳定、普遍可用的版本。”