谷歌推出迄今最强大的文本嵌入模型:Gemini Embedding

2025年03月10日 由 alex 发表 1393 0

谷歌周五在其 Gemini 开发者 API 中添加了一个全新的实验性文本“嵌入”模型 Gemini Embedding。


屏幕截图2025-03-10095859


嵌入模型将文本输入(例如单词和短语)转换为数字表示形式(称为嵌入),以捕获文本的语义含义。嵌入用于各种应用,例如文档检索和分类,部分原因是它们可以降低成本并改善延迟。


亚马逊、Cohere 和 OpenAI 等公司都通过各自的 API 提供嵌入模型。谷歌之前也提供过嵌入模型,但 Gemini Embedding 是其首个在 Gemini 系列 AI 模型上进行训练的模型。


谷歌在一篇博客文章中表示: “该嵌入模型是在 Gemini 模型上进行训练的,它继承了 Gemini 对语言和细微语境的理解,使其适用于广泛的用途。” “我们已经将我们的模型训练得非常通用,在金融、科学、法律、搜索等不同领域都表现出色。”


Google 声称,Gemini Embedding 的性能超越了其之前最先进的嵌入模型 text-embedding-004,并在流行的嵌入基准上取得了具有竞争力的性能。与 text-embedding-004 相比,Gemini Embedding 还可以一次接受更大的文本和代码块,并且支持的语言数量是其两倍(超过 100 种)。


Gemini_embedding_blog_post_-_benchmark_table.original


谷歌指出,Gemini Embedding 处于“实验阶段”,容量有限,可能会发生变化。该公司在其博客文章中写道:“我们正在努力在未来几个月内推出稳定、普遍可用的版本。”

文章来源:https://techcrunch.com/2025/03/07/google-debuts-a-new-gemini-based-text-embedding-model/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消