英伟达与微软合作,在Azure推出AI工厂和新基础模型

2023年11月16日 由 daydream 发表 324 0

英伟达(Nvidia)今天宣布,将在微软公司(Microsoft)的Azure云上推出一个AI工厂,允许任何客户打造自己的聊天机器人、预测或生成图像的AI。


微信截图_20231116111028


该公司在今天的微软Ignite 2023会议上宣布了这一服务,称其为Nvidia提供并托管在Azure上的生成式AI工厂,将公司最佳的AI企业基础设施和开发者工具集结到一起,提高开发者的工作效率。


Nvidia企业计算副总裁Manuvir Das表示:“现在,Azure提供了整个端到端的工作流程,包括所有基础设施和软件。这意味着任何客户都可以进入Azure市场,并获取所需的组件。”


该提供包括DGX Cloud平台,这是一种强大的云硬件提供方案,允许公司在云基础设施上按需提供和运行的AI工作负载,现在可以通过Azure Marketplace获得。公司可以启动DGX Cloud实例,使用8个A100 80 GB图形处理单元,可以进行多节点扩展,为训练和微调等AI处理提供极高的计算能力。DGX Cloud此前已在Oracle Cloud上提供。


Nvidia还宣布计划明年在Azure上引入其新推出的H200 Tensor Core GPU,以支持更大规模的工作负载。这款新的GPU模型是专为最大的AI需求而设计的,包括LLM和生成式AI模型。与前一代相比,它提供了141 GB的HBM3e内存,是之前的1.8倍,并且可达到4.8 Tbps的内存带宽,增加了1.4倍。


Nvidia优化的AI基础模型


为了支持行业自定义生成式AI模型的加速,Nvidia宣布推出了自己的一系列生成式AI基础模型,名为Nemotron-3 8B,并提供针对优化开源模型的端点。


Nemotron-3 8B系列是一套80亿参数LLM模型,经过优化以在Nvidia硬件上运行,适用于希望构建安全可靠的生成式AI应用的行业客户。这些模型支持多语言,并且该公司表示它们是“在负责任的数据集上训练”,在企业部署中具有与更大型模型相当的性能。


Nemotron-3 8B模型开箱即用,精通50多种不同的语言,包括英语、德语、俄语、西班牙语、法语、日语、中文、韩语、意大利语和荷兰语。


Nvidia AI软件高级总监Erik Pounds表示:“新的Nvidia Nemotron-3 8B模型系列还包括支持创建当今最先进企业聊天和问答应用的模型,适用于包括医疗保健、电信和金融服务在内的各行业。”


该公司还提供了一套优化模型的精心筛选集,其中包括常见的社区模型,如Meta Platform Inc.的Llama 2、巴黎初创公司Mistral AI的Mistral以及生成图像模型Stable Diffusion XL。


基础模型可以使用企业客户专有的数据进行定制,在特定用例中进行特殊化。一旦根据实际需要定制,它们可以在几乎任何地方部署,用于基于AI的应用程序。

文章来源:https://siliconangle.com/2023/11/15/nvidia-announces-generative-ai-foundry-azure-new-foundational-models/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消