去年12月,OpenAI推出了其o3“推理”AI模型,并与ARC-AGI基准测试的创建者合作,展示了o3的能力。然而,数月之后,测试结果得到了修正,现在的表现相较于最初略显逊色。
上周,负责维护和管理ARC-AGI的Arc Prize基金会更新了其对o3的近似计算成本估算。该组织最初估计,其测试的o3最佳配置(o3 high)解决单个ARC-AGI问题的成本约为3000美元。但现在,Arc Prize基金会认为成本要高得多,可能达到每项任务30000美元。
这一修正具有重要意义,因为它揭示了当前最先进的AI模型在某些任务上可能会非常昂贵,至少在初期如此。OpenAI尚未为o3定价,也尚未发布该模型。但Arc Prize基金会认为,OpenAI的o1-pro模型定价是一个合理的参考。
值得注意的是,o1-pro是OpenAI迄今为止最昂贵的模型。
Arc Prize基金会的联合创始人之一表示,由于测试时使用的计算量,他们认为o1-pro与o3的真实成本更为接近。然而,这仍然是一个近似值,并且在官方定价公布之前,他们已将o3在排行榜上标记为预览状态,以反映这种不确定性。
考虑到o3 high模型据报道使用的计算资源量,其高昂的价格并不意外。据Arc Prize基金会称,o3 high在解决ARC-AGI问题时使用的计算资源是o3 low(o3的最低计算配置)的172倍。
此外,有关OpenAI考虑为企业客户推出昂贵计划的传言已流传了一段时间。今年3月初,有报道称,该公司可能计划对专门的AI“代理”(如软件开发代理)收取高达每月20000美元的费用。
有观点认为,即使OpenAI最昂贵的模型,其成本也远低于典型的人类合同工或员工的薪酬。但AI研究者Toby Ord在X平台上的一篇帖子中指出,这些模型可能并不那么高效。例如,o3 high在ARC-AGI中每项任务都需要尝试1024次才能达到其最佳得分。