Open AI宣布推出新一代嵌入模型,这些模型能够将文本输入转换为数值形式,以用于各种机器学习应用程序。
随着公司推出新版本的 GPT-4 Turbo 和 moderation 模型,GPT-3.5 Turbo 的定价降低,以及通过其应用程序编程接口降低访问其模型的费用,OpenAI 还宣布了新嵌入模型。
在人工智能行业中,嵌入指的是代表自然语言或代码中抽象概念的数字序列。它们使得机器学习算法在进行聚类或检索等任务时更容易理解这些内容之间的关系。正是这种能力使它们对于知识检索等应用至关重要,无论是使用ChatGPT还是助手API。
新的嵌入模型包括text-embedding-3-small和text-embedding-3-large。与上一代text-embedding-ada-002模型相比,它们为开发者提供了更高的性能和更低的价格。更重要的是,OpenAI表示它们可以创建最大3,072维的嵌入,这意味着它们可以捕捉到更多的语义信息,以提高下游任务的准确性。
该公司在博客文章中解释说,新模型有助于将最常用的MIRACL多语言检索基准的平均分数从31.4%提高到54.9%。此外,MTEB英语任务基准的平均分数从61%上升到了64.6%。更重要的是,text-embedding-3-small 的定价现在比 text-embedding-ada-002 低五倍,这使其更加实惠,因此更易于开发人员访问。。
GPT-4 Turbo和GPT-3.5 Turbo大型多模态模型也得到了更新,这些模型能够理解人类文本和语言,并生成包括代码在内的新鲜内容。据称,这些模型的最新版本在指令遵循、更可重复的输出和支持并行函数调用方面有所改进。此外,还推出了GPT-3.5 Turbo的16k版本,该版本能够处理比上一代4k版本更复杂输入和输出。
GPT-4 Turbo也得到了一个有趣的修复,“这个模型比之前的预览模型更彻底地完成代码生成等任务,旨在减少模型不完成任务的‘懒惰’情况。”OpenAI的研究人员写道。
OpenAI还更新了其文本审核模型,该模型旨在检测文本输入和输出是否敏感或不安全。据该公司称,最新版本支持更多的语言和领域,并提供对其预测的更好解释。
最后,OpenAI正在推出一种新的方式,让开发者管理他们的API密钥并了解他们使用这项服务的情况。通过这次更新,开发者可以为每个应用程序或服务创建多个API密钥,并在OpenAI仪表板内监控它们的单独使用和计费详情。这有助于他们更好地理解嵌入OpenAI模型的每个应用程序或服务的成本。此外,该公司表示它将通过API访问GPT-3.5 Turbo的价格降低25%,使其更加可及。
根据OpenAI的说法,如今的更新是其持续努力提高其AI模型质量和能力的一部分,同时使它们对开发者更有用且更经济实惠。该公司还邀请开发者参与评估,以帮助其针对不同工作负载改进模型能力。