为了管理企业中部署的多个AI代理,微软研究人员近期推出了一款名为Magnetic-One的多代理基础设施。该框架允许单个AI模型驱动多个辅助代理,这些代理能够协同工作,以完成不同场景下的复杂多步骤任务。
Magnetic-One是一个通用代理系统,以开源形式发布,并附带自定义的微软许可协议,供研究者和开发者使用,包括商业用途。同时,微软还发布了一款名为AutoGenBench的开源代理评估工具,该工具基于其先前发布的Autogen框架构建,用于测试多代理通信与合作的能力。
通用代理系统的核心目标是解决需要多个步骤才能完成的任务,这些任务常见于组织日常运营或个人日常生活中。从微软提供的示例来看,Magnetic-One旨在处理诸如描述S&P 500趋势、查找并导出缺失的引文,甚至订购沙威玛等日常任务。
Magnetic-One框架包含一个名为Orchestrator的代理,用于指导其他四个类型的代理:Websurfer代理可以控制基于Chromium的网页浏览器,进行网页导航和搜索,还能点击、输入和概括内容;FIleSurfer代理负责读取本地文件、列出目录和浏览文件夹;Coder代理负责编写代码、分析其他代理提供的信息并创建新文件;ComputerTerminal则提供一个控制台,供Coder代理的程序执行。
Orchestrator代理负责规划任务、创建任务流程记录,并在任务执行过程中跟踪进度。如果代理遇到困难,Orchestrator会重新分配任务或制定新计划。
Magnetic-One虽然基于OpenAI的GPT-4o开发,但它是语言模型无关的。开发者可以为Orchestrator代理部署一个强大的推理语言模型,如GPT-4o,而其他代理则可以使用不同的语言模型或小型语言模型。
随着AI代理在企业中的部署逐渐增多,管理这些代理并确保它们能够无缝协作以完成任务变得越来越重要。目前,多家科技公司正在竞争AI编排框架市场,包括OpenAI的Swarm框架、CrewAI的多代理构建器以及被广泛使用的LangChain等。然而,AI代理在企业中的部署仍处于早期阶段,最佳的多代理框架仍在探索中。