低代码人工智能开发平台 Predibase 公司表示,它将推出一个包含不少于 25 个开源和微调大型语言模型的集合,该公司声称这些模型可以与 OpenAI 的 GPT-4 相媲美,甚至更胜一筹。
该 LLM 模型集被称为 LoRA Land,旨在满足文本摘要、代码生成等用例的需求。Predibase 称,它为企业提供了一种更具成本效益的方式,用于训练高精度、专业化的生成式人工智能应用。
该公司于去年5月在扩大的A轮融资中筹集了1220万美元,是低代码机器学习开发平台的创建者,它能让开发人员以更低的成本更轻松地构建、迭代和部署强大的人工智能模型和应用。这家初创公司表示,它的使命是帮助小公司与 OpenAI 和 Google LLC 等最大的人工智能公司竞争,让它们不再需要使用复杂的机器学习工具,取而代之的是一个易于使用的框架。
使用 Predibase 的平台,团队只需定义他们希望人工智能模型使用预建 LLM 预测的内容,剩下的就交给该平台了。新手用户可以从各种推荐的模型架构中选择入门模型,而经验丰富的从业者则可以使用其工具对任何人工智能模型的参数进行微调。Predibase 声称,使用其工具,可以在短短几天内从零开始启动并运行人工智能应用。
Predibase 表示,随着 LoRA Land 的推出,公司将有能力在单个图形处理单元上经济高效地提供多个经过微调的 LLM。LoRA Land LLM建立在开源的LoRAX框架和Predibase的无服务器微调端点之上,每个端点都针对特定的用例。
Predibase认为,从头开始构建GPT模型,甚至对拥有数十亿参数的现有LLM进行微调,其成本都极其高昂。因此,更小、更专业的LLM正成为一种流行的替代方案,开发人员利用参数高效的微调和低秩适应等方法,以极低的成本创建高性能的AI应用。
Predibase表示,它已将这些技术纳入其微调平台。因此,客户只需选择最适合其用例的LLM,并以非常实惠的方式进行微调。
为了证明其观点,Predibase表示,LoRA Land中的25个LLM的平均GPU成本低于8美元。因此,客户将能够使用LoRA Land在一个GPU上微调可能的数百个LLM,初创公司表示。这不仅更便宜,而且由于不需要等待冷GPU在微调每个模型之前启动,公司还可以比以前更快地测试和迭代。
Constellation Research Inc.副总裁兼首席分析师Andy Thurai表示,鉴于无论公司如何实施AI,其成本通常都非常高昂,因此该公司提供了一个非常有说服力的产品。他解释说,尽管通过应用程序编程接口访问LLM的初步实验成本相当低廉,但当部署全面的AI实施时,成本会迅速上升。
他补充说,“从资源角度来看,另一种涉及微调开源LLM的替代方案也可能相当昂贵,并且在技能方面具有挑战性,这给没有合格AI工程师的公司带来了问题。”这位分析师表示,Predibase现在提供了一种第三种选择,即一套可以进一步细化和部署在单个GPU上的25个微调后的LLM。
Thurai表示,这是一个有趣的想法,可能对小型公司产生重大影响,因为许多小型、专门构建的模型已经表明,它们可以在一些非常特定的用例中超越大型LLM。“使用开源LLM的愿望和AI技能的有限可用性可能会使这对从这一角度考虑的企业产生重大影响。”Thurai说。“如果企业决定为每个用例使用不同的微调模型,Predibase的提供可能会大受欢迎。”
该公司的无服务器微调端点部署选项意味着客户甚至可以创建无需GPU资源的AI模型,这意味着运行成本也大大降低了,分析师补充道。“虽然Predibase声称其模型的表现优于GPT-4,还有待证实,但听起来这对许多AI应用来说是一个非常吸引人的替代方案。”Thurai说。
联合创始人兼首席执行官Dev Rishi表示,该公司的一些客户已经认识到了使用更小、经过微调的LLM为不同应用提供优势的好处。其中一位客户是AI初创公司Enric.ai Inc.,该公司为教练和教育工作者提供了一个平台,用于创建融入文本、图像和语音的AI聊天机器人。
“这需要使用LLM进行许多用例,如翻译、意图分类和生成。”Enric.ai首席执行官Andres Restrepo说。“通过从OpenAI转向Predibase,我们能够在实时环境中对许多专业的开源模型进行微调和提供服务,每年节省超过100万美元,同时为我们的观众创造引人入胜的体验。最重要的是,我们拥有这些模型的所有权。”
开发人员今天可以通过Predibase的免费试用产品开始微调LoRA Land LLMs。它还为大型项目在心的公司提供免费开发者层级(资源有限)和付费选项。