Salesforce发布开源“大型动作模型”xLAM系列

2024年09月09日由 daydream 发表 391 0

Salesforce公司近日宣布，其内部研发的“大型动作模型”（Large Action Models，简称xLAM）系列已正式开源。这一系列模型据称相较于市场上现有的大型人工智能语言模型，能够以更低的成本实现更高的准确性。

微信截图_20240909113639

同时，Salesforce还推出了xGen-Sales模型，这是一款专为企业自主销售任务设计的专有模型，旨在提升Agentforce平台的功能。Agentforce是Salesforce的一个平台，允许用户设计能够与客户互动的AI代理。

xLAM系列模型由Salesforce的AI研究部门开发，旨在简化执行动作而非仅生成内容的AI代理的创建过程，从而降低了模型的复杂性。Salesforce表示，xLAM模型相较于传统的大型语言模型更小、更精简，且在工具使用方面表现更佳。这些模型专注于执行特定任务，而非复杂的对话、摘要或生成能力。

xLAM家族的核心是超小型的xLAM-1B模型，被研究团队戏称为“Tiny Giant”。尽管仅包含10亿个参数，但在工具使用和推理任务上，该模型的表现显著优于包括OpenAI的GPT-3.5和Anthropic PBC的Claude在内的更大规模模型。

xLAM-1B的紧凑设计使其能够在智能手机和平板电脑等移动设备上运行，实现如天气应用数据查询等自动化命令。Salesforce已将xLAM-1B及其三个其他版本（xLAM-7B、xLAM-8x7B和xLAM-8x22B）在Hugging Face开源平台上发布，供开发者和企业用户试用。

在开发这些新型动作导向模型时，研究团队面临的主要挑战之一是训练数据的需求。特别是xLAM-1B模型，为了保持其小型化，必须使用高度特定的数据进行精细调整。由于动作导向、工具使用型AI模型尚不成熟，团队不得不采用合成数据生成技术来填补数据空白，以确保模型既紧凑又高效。

Salesforce的这一举措反映了行业对大型生成式AI模型发展趋势的反思。尽管像Google PaLM和GPT-3这样的模型拥有数百亿个参数，但它们在部署和管理上带来了成本和延迟的挑战。xLAM-1B的成功表明，通过专业化的设计，可以在更小的模型中实现大型模型的性能。

文章来源：https://siliconangle.com/2024/09/06/salesforce-releasing-powerful-ai-large-action-models-open-source/

标签：

Salesforce 动作模型人工智能

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 01.AI发布Yi-Coder，以紧凑高效挑战AI编码巨擘

下一篇 HyperWrite推Reflection 70B：AI语言模型新突破

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来

每个人都应该知道的48个AI术语

openwebtext glue shunk031/JGLUE piqa wikitext sciq EleutherAI/lambada_openai facebook/flores

AI热点

行业学习机器学习人工智能公司板人工智能未来机器人视觉识别

AI工具

更多工具 »

火山写作

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub Copilot

GitHub AI编程工具

Adobe Firefly

Adobe最新推出的AI图片生成工具

文心一格

AI艺术和创意辅助平台

本周热门

热门企业

热门职位

Maluuba

20000~40000/月

Unity技术经理

Cisco

25000~30000/月深圳市

高级数据分析工程师

PilotAILabs

30000~60000/年深圳市