为增强市场竞争力,与谷歌等竞争对手抗衡,OpenAI近日推出Flex处理选项,该选项通过降低AI模型使用价格来吸引用户,但代价是响应时间延长且资源可能出现暂时性不可用。
目前,Flex处理选项处于测试阶段,仅适用于OpenAI近期发布的o3和o4-mini推理模型。该选项主要针对优先级较低或非生产环境的任务,如模型评估、数据增强及异步工作负载等。
Flex处理选项显著降低了API成本,价格减半。对于o3模型,输入令牌费用从每百万10美元降至5美元,输出令牌费用从每百万40美元降至20美元。o4-mini模型同样受益,输入令牌费用从每百万1.10美元降至0.55美元,输出令牌费用从每百万4.40美元降至2.20美元。
随着前沿AI技术成本不断攀升,同时竞争对手纷纷推出性价比更高的预算型模型,OpenAI此举意在保持市场竞争力。谷歌于周四发布的Gemini 2.5 Flash推理模型便是一个典型例子,该模型在性能上与DeepSeek的R1模型相当甚至更优,且输入令牌成本更低。
在宣布推出Flex处理选项的客户邮件中,OpenAI还指出,使用层级为1至3级的开发者需完成新引入的身份验证流程,方可访问o3模型。此外,o3模型及其他模型的推理摘要和流式API支持功能也需通过身份验证后才能使用。
OpenAI此前曾表示,身份验证旨在防止违规用户滥用其服务政策。