优化LLM性能：GeckOpt系统降低计算成本

2024年04月29日由 daydream 发表 472 0

大型语言模型（LLM）作为计算平台的基石，正推动着一系列广泛技术应用的革新。这些模型在海量数据的处理与解读中扮演着核心角色，但高昂的运营成本以及工具使用上的效率问题一直困扰着它们。

如何在不增加高额计算费用的情况下，提升LLM的性能，成为业内的一大挑战。传统上，LLM在系统中运行时，往往会为各种任务启动众多工具，而不去细致考虑每个操作的实际需求。这种广撒网式的工具启动方式，无疑会大量消耗计算资源，导致数据处理任务的成本剧增。

如今，新兴的方法论正在优化LLMs中的工具选择方式，更加注重根据任务的具体需求来精准部署工具。通过运用先进的推理能力，这些系统能够洞察用户命令的潜在意图，从而有针对性地精简执行任务所需的工具集。这种策略性的减少工具启动，直接提升了系统效率，降低了计算开销。

微软公司的研究人员开发的GeckOpt系统，就是基于意图进行工具选择的先进方法的代表。这种方法在用户意图的预分析基础上，优化API工具的选择，确保在任务执行前就已经选定了最符合特定任务要求的工具。通过缩小潜在工具的选择范围，GeckOpt最小化了不必要的工具启动，将计算能力集中在了最需要的地方。

在拥有超过100个GPT-4-Turbo节点的Copilot平台上实施GeckOpt，初步结果令人振奋。在维持高运营标准的同时，该系统成功减少了高达24.6%的令牌消耗。这些效率提升不仅体现在系统成本的降低和响应时间的缩短上，而且并未对性能质量产生显著影响。实验数据显示，成功率的偏差在可忽略不计的1%范围内，这充分证明了GeckOpt在不同操作条件下的可靠性。

微信截图_20240429101956

GeckOpt在简化LLM操作方面的成功，为广泛采用基于意图的工具选择方法提供了强有力的支撑。通过有效减轻运营负担和优化工具使用，该系统不仅降低了成本，还提高了LLM在不同平台上的可扩展性。引入此类技术有望改变计算效率的现状，为大规模AI实施提供一个可持续且成本效益高的模型。

微信截图_20240429102006

总的来说，通过整合如GeckOpt这样的基于意图的工具选择系统，我们在优化大型语言模型基础设施方面取得了重要进展。这种方法显著降低了LLM系统的运营需求，促进了成本效益高且高效的计算环境的形成。随着这些模型的不断发展和应用范围的扩大，保持经济可行性的同时充分利用AI的潜力，将是我们技术进步的关键所在。

文章来源：https://www.marktechpost.com/2024/04/27/microsofts-geckopt-optimizes-large-language-models-enhancing-computational-efficiency-with-intent-based-tool-selection-in-machine-learning-systems/

标签：

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇元象公司推出多模态大型模型XVERSE-V并开源，支持任意宽高比图像输入

下一篇 AI21 Labs发布企业专属Jamba-Instruct模型

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来