IBM推出Granite系列模型,进军竞争激烈的AI领域

2023年09月08日 由 daydream 发表 293 0

全球计算巨头IBM正在进入竞争激烈的生成AI竞赛,宣布为其早前宣布的watsonx数据科学平台提供新的生成式AI功能和模型。


Ibm_px_xt_color-800x430


被命名为“Granite”的生成式AI模型与流行的GPT-4等LLM模型非常相似,使用输入来分析和总结文本内容并输出结果。IBM在一份官方新闻稿中表示:“正如花岗岩是一种坚固的多用途材料,在建筑和制造领域有很多用途,IBM相信这些Granite模型将为您的业务带来持久的价值”,但没有透露关于模型的更多细节。


然而,与其他在普通用户中广泛使用的LLM不同,IBM将其Granite模型定位为企业和商业客户,这是其最强项。由IBM研究开发的Granite模型——Granite.13b.instruct和Granite.13b.chat——采用“解码器”架构,类似于其他大型语言模型预测序列中下一个单词的能力。


公司进一步补充说:“在IBM,我们专注于构建面向业务的模型。Granite系列模型也不例外,因此我们使用各种数据集对其进行训练——预处理前总计7TB,预处理后总计2.4TB——以产生1万亿个令牌,即对模型具有语义意义的字符集合。"


由于Granite系列模型面向企业消费者,IBM表示对这些部署的安全性进行了额外关注。在训练中使用的每个数据集都要经过定义的治理、风险和合规(GRC)审查流程。


初始的Granite模型只是一个开始:计划在其他语言中推出更多模型,同时IBM也正在准备更多经由IBM训练的模型。IBM最近还宣布,现在已向特定客户提供Meta的Llama 2-chat 700亿参数模型以供提前体验,并计划在9月后期广泛提供。此外,IBM将托管StarCoder,一个用于代码的大型语言模型,包括80多种编程语言、Git提交、GitHub问题和Jupyter笔记本。


除了新模型外,IBM还将在 watsonx.ai 工作室推出新的辅助功能。本月晚些时候,将推出该公司调整工作室的第一个版本,其中将包括提示调整,这是一种高效、低成本的方式,使客户能够通过在自己可信赖的数据上对模型进行训练,将基础模型适应其独特的下游任务。我们还将推出合成数据生成器,帮助用户从自定义数据模式或内部数据集创建人工表格数据集。

文章来源:https://thetechportal.com/2023/09/07/ibm-is-throwing-its-hat-in-the-ultra-competitive-generative-ai-ring/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
写评论取消
回复取消