英伟达与微软合作，在Azure推出AI工厂和新基础模型

2023年11月16日由 daydream 发表 416 0

英伟达（Nvidia）今天宣布，将在微软公司（Microsoft）的Azure云上推出一个AI工厂，允许任何客户打造自己的聊天机器人、预测或生成图像的AI。

微信截图_20231116111028

该公司在今天的微软Ignite 2023会议上宣布了这一服务，称其为Nvidia提供并托管在Azure上的生成式AI工厂，将公司最佳的AI企业基础设施和开发者工具集结到一起，提高开发者的工作效率。

Nvidia企业计算副总裁Manuvir Das表示：“现在，Azure提供了整个端到端的工作流程，包括所有基础设施和软件。这意味着任何客户都可以进入Azure市场，并获取所需的组件。”

该提供包括DGX Cloud平台，这是一种强大的云硬件提供方案，允许公司在云基础设施上按需提供和运行的AI工作负载，现在可以通过Azure Marketplace获得。公司可以启动DGX Cloud实例，使用8个A100 80 GB图形处理单元，可以进行多节点扩展，为训练和微调等AI处理提供极高的计算能力。DGX Cloud此前已在Oracle Cloud上提供。

Nvidia还宣布计划明年在Azure上引入其新推出的H200 Tensor Core GPU，以支持更大规模的工作负载。这款新的GPU模型是专为最大的AI需求而设计的，包括LLM和生成式AI模型。与前一代相比，它提供了141 GB的HBM3e内存，是之前的1.8倍，并且可达到4.8 Tbps的内存带宽，增加了1.4倍。

Nvidia优化的AI基础模型

为了支持行业自定义生成式AI模型的加速，Nvidia宣布推出了自己的一系列生成式AI基础模型，名为Nemotron-3 8B，并提供针对优化开源模型的端点。

Nemotron-3 8B系列是一套80亿参数LLM模型，经过优化以在Nvidia硬件上运行，适用于希望构建安全可靠的生成式AI应用的行业客户。这些模型支持多语言，并且该公司表示它们是“在负责任的数据集上训练”，在企业部署中具有与更大型模型相当的性能。

Nemotron-3 8B模型开箱即用，精通50多种不同的语言，包括英语、德语、俄语、西班牙语、法语、日语、中文、韩语、意大利语和荷兰语。

Nvidia AI软件高级总监Erik Pounds表示：“新的Nvidia Nemotron-3 8B模型系列还包括支持创建当今最先进企业聊天和问答应用的模型，适用于包括医疗保健、电信和金融服务在内的各行业。”

该公司还提供了一套优化模型的精心筛选集，其中包括常见的社区模型，如Meta Platform Inc.的Llama 2、巴黎初创公司Mistral AI的Mistral以及生成图像模型Stable Diffusion XL。

基础模型可以使用企业客户专有的数据进行定制，在特定用例中进行特殊化。一旦根据实际需要定制，它们可以在几乎任何地方部署，用于基于AI的应用程序。

文章来源：https://siliconangle.com/2023/11/15/nvidia-announces-generative-ai-foundry-azure-new-foundational-models/

标签：

英伟达微软 Azure

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇谷歌发布GraphCast：人工智能天气预报模型超越传统算法

下一篇谷歌Deepmind推出Lyria音乐AI模型，助力音乐创作进步和突破

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来