Salesforce公司近日宣布,其内部研发的“大型动作模型”(Large Action Models,简称xLAM)系列已正式开源。这一系列模型据称相较于市场上现有的大型人工智能语言模型,能够以更低的成本实现更高的准确性。
同时,Salesforce还推出了xGen-Sales模型,这是一款专为企业自主销售任务设计的专有模型,旨在提升Agentforce平台的功能。Agentforce是Salesforce的一个平台,允许用户设计能够与客户互动的AI代理。
xLAM系列模型由Salesforce的AI研究部门开发,旨在简化执行动作而非仅生成内容的AI代理的创建过程,从而降低了模型的复杂性。Salesforce表示,xLAM模型相较于传统的大型语言模型更小、更精简,且在工具使用方面表现更佳。这些模型专注于执行特定任务,而非复杂的对话、摘要或生成能力。
xLAM家族的核心是超小型的xLAM-1B模型,被研究团队戏称为“Tiny Giant”。尽管仅包含10亿个参数,但在工具使用和推理任务上,该模型的表现显著优于包括OpenAI的GPT-3.5和Anthropic PBC的Claude在内的更大规模模型。
xLAM-1B的紧凑设计使其能够在智能手机和平板电脑等移动设备上运行,实现如天气应用数据查询等自动化命令。Salesforce已将xLAM-1B及其三个其他版本(xLAM-7B、xLAM-8x7B和xLAM-8x22B)在Hugging Face开源平台上发布,供开发者和企业用户试用。
在开发这些新型动作导向模型时,研究团队面临的主要挑战之一是训练数据的需求。特别是xLAM-1B模型,为了保持其小型化,必须使用高度特定的数据进行精细调整。由于动作导向、工具使用型AI模型尚不成熟,团队不得不采用合成数据生成技术来填补数据空白,以确保模型既紧凑又高效。
Salesforce的这一举措反映了行业对大型生成式AI模型发展趋势的反思。尽管像Google PaLM和GPT-3这样的模型拥有数百亿个参数,但它们在部署和管理上带来了成本和延迟的挑战。xLAM-1B的成功表明,通过专业化的设计,可以在更小的模型中实现大型模型的性能。