IBM发布全新Granite 3.2模型家族,提供所需的推理功能

2025年02月27日 由 佚名 发表 46 0

IBM推出了全新的Granite AI模型家族,具备实验性的推理、视觉和预测能力。

微信截图_20250227102623

与以往的发布一样,IBM开放了其模型,采用宽松的开源Apache 2.0许可证。所有Granite模型现在都可以在Hugging Face上获取,部分模型也可以在IBM watson.ai和其他平台上使用。

新家族包括其旗舰的仅文本大型语言模型Granite 3.2 Instruct变体,提供8B和2B版本。它能够执行摘要、问题解决和代码生成等任务,并设计为遵循指令。这些类型的模型最适合用于构建AI助手和代理。两者都经过训练,使用类似于其他行业标准模型的“思维链”推理,但IBM工程师设计它们更小且性能更高。

每个模型中的推理能力也可以通过编程进行开启和关闭。这意味着IBM创建了一个可以是对话模型或推理模型的单一模型,而不是发布单独的“推理模型”。由于推理在部署期间需要大量计算,运行时关闭不需要的推理可以节省大量电力。

“AI的下一个时代关注的是效率、集成和现实世界的影响——企业可以在不需要过多计算支出的情况下实现强大的成果”IBM AI研究副总裁Sriram Raghavan(如图)表示。

推理模型通过“逐步”思考问题,在行业中通常称为“思维链”。自从DeepSeek的R1发布以来,这些模型越来越受欢迎。大多数推理模型在生成最终答案之前扫描整个推理空间以发现最佳逻辑“路径”。然而,并不总是需要遵循整个路径一旦确定某个路径走向不佳。

IBM工程师开发了一种新颖的推理缩放技术,降低了推理任务的计算成本,通过添加奖励系统,通过使用第二个过程奖励模型。这个奖励模型监视LLM,并在推理时将其重定向到具有更高置信度结果的逻辑路径。结合可以扫描整个逻辑空间的搜索技术,IBM研究人员表示,他们能够创建一个更小、更高效的推理模型方法,与R1相比,它在一个模型中完成所有工作。

“DeepSeek的R1发布在许多方面是对IBM更小、高效模型策略的认可”SiliconANGLE的姊妹市场研究公司theCUBE Research的首席分析师Dave Vellante说。“IBM的简报强化了这一观点,指出DeepSeek早在2024年12月就使用了专家混合和其他效率方法,但直到最近的R1聚光灯才获得市场关注。我们相信这反映了IBM对训练效率和专用架构的做法。”

IBM表示Granite 3.2 8B可以调整以媲美更大的模型,如Claude 3.5 Sonnet和OpenAI GPT-4o在AIME2024和MATH500测试等数学推理基准上。

新的多模态视觉模型和更小的护栏模型

IBM还发布了新的多模态Granite Vision 3.2 2B,具备计算机视觉能力,旨在帮助企业公司处理视觉文档理解。

Granite Vision可以处理各种各样的视觉理解任务,但最适合文档。虽然大多数VLM设计用于视觉任务,但其中不多擅长光学字符或文本识别,IBM的工程团队花费大量时间训练Vision 3.2以适应布局、字体、图表和信息图的独特视觉特征。

Granite Guardian 3.2代表了IBM最新的护栏AI模型,旨在检测和突出提示和响应中的风险。公司表示其性能与3.1相当,但更快且成本更低。

Guardian 3.2的一个好处是它在监控输入和输出时提供“口头化的置信度”,指示置信度水平。与其指示二元“是”或“否”,它以“高”或“低”表示置信度水平。这为开发人员提供了更好的指示他们是否可以信任或拒绝输出,给他们一个可以使用的阈值。

除了更新的8B版本,IBM发布了两个新模型尺寸。第一个是精简的50亿参数版本,保留了接近原始的性能。第二个是Granite 3.2 3B-A800M,通过微调专家混合基础模型创建。它通过一次激活其30亿参数中的8亿来提供高性能的低成本。

IBM的Granite家族中的最后一个模型包括紧凑的Granite Timeseries模型,也称为Tiny Time Mixers。最新的Granite-Timeseries-TTM-R2.1扩展了模型能力,包括长达两年的每日和每周预测。时间序列模型在金融、经济、供应链需求预测和零售季节性库存规划等行业中用于预测长期趋势。

文章来源:https://siliconangle.com/2025/02/26/ibm-releases-new-granite-3-2-family-models-include-reasoning-want/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消