AI21 Labs有限公司今日宣布推出Maestro,这是一款软件系统,旨在显著提升大型语言模型的输出质量。
AI21总部位于以色列,是一家人工智能初创公司,已获得来自Nvidia、谷歌及其他投资者的3.36亿美元资金支持。公司提供了一系列面向企业的LLM,称为Jamba。这些模型可以处理多达256,000个标记的提示,并支持检索增强生成(RAG),这是一种允许AI分析其训练数据集中未包含的信息的机器学习技术。
在企业将LLM投入生产之前,他们会采取措施降低输出质量问题的风险。这个过程通常涉及创建一个自动检查提示响应错误的软件工作流程。这样的工作流程可以显著降低幻觉的风险,但它们的创建和维护都很困难。
AI21新推出的Maestro平台旨在解决这一挑战。该平台被描述为一个AI规划与编排系统,减少了缓解LLM输出错误所需的工作量,并简化了多个相关任务。
要使用Maestro,工作人员需要提供一个提示以及在处理提示时应满足的一组要求。例如,用户可以指定生成LLM响应的成本不应超过某个阈值。AI21表示,Maestro会自动应用这些客户提供的要求,从而减少手动编码的需要。
当收到复杂的提示时,Maestro会将任务分解为子步骤。以这种方式简化任务已被证明可以提高LLM响应的质量。在完成该过程后,Maestro会运行模拟以确定将请求输入LLM并提供准确答案的最有效方法。
AI21表示,该平台会考虑多种处理方法,并选择最有可能提供正确LLM响应的方法。如有必要,Maestro还可以扩展推理时间计算。这是一种通过增加任务所花费的时间和基础设施来提高推理优化LLM准确性的方法。
在生成提示响应后,Maestro会检查其是否有错误。该系统还会创建一个日志,显示生成提示响应的每个步骤。工作人员可以查看此日志以验证LLM输出的准确性。
在一系列内部测试中,AI21将Maestro应用于几个流行的LLM。结果表明,该系统在某些情况下可以将AI模型的准确性提高多达50%。根据AI21的说法,这意味着像o3-mini这样的推理优化LLM在连接到Maestro时可以正确回答超过95%的提示。
公司设想客户将该系统应用于多种用例。它表示,Maestro可以使LLM更好地分析复杂文档和回答用户问题。此外,该系统适用于自动化重复的业务工作,如数据输入。
“企业大规模采用AI是下一次工业革命的关键,”AI21联合首席执行官Ori Goshen表示。“AI21的Maestro是迈向这一未来的第一步——超越现有解决方案的不可预测性,提供在规模上可靠的AI。”
Maestro目前处于早期访问阶段。AI21计划在今年晚些时候使该平台普遍可用。