NVIDIA揭晓升级版NeMo框架，提高了LLM的训练效率

登录注册

资讯

学习

基础知识理论实践学习教程

企业招聘

下载

模型数据集

AI工具箱

企业服务

EVA 智能HR 视频AI

ChatGPT 人工智能应用人工智能未来计算机视觉

热门新闻

行业人工智能

为什么数据污染对LLM来说是一个大问题

机器人康奈尔大学

康奈尔大学推出新的社交机器人，更柔软，更人性化

行业人工智能

所以，能动手就别吵吵了

常用工具

火山写作

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub Copilot

GitHub AI编程工具

Adobe Firefly

Adobe最新推出的AI图片生成工具

文心一格

AI艺术和创意辅助平台

您尚未登录账户

请先登录您的atyun账户，方可使用该功能

仅限企业账户使用

该功能仅限企业账号使用，开通企业账号可享受更多服务，是否现在注册企业账号？

立即注册企业账号

暂不需要

您的企业账号申请正在审核中

审核通过后即可使用此功能，请耐心等待~

2023年12月06日由 camellia 发表 632 0

NVIDIA已经更新了其NeMo框架，并在H200 GPU上增强了大型语言模型（LLM）的训练。这些发展针对的是人工智能领域的开发者和研究人员，特别是那些从事AI基础模型如Llama 2和Nemotron-3的工作。

经过更新的NeMo框架，现在已经成为云原生的，支持更广泛的模型架构，并采用先进的并行技术以实现高效训练。特别地，H200 GPU在提升Llama 2模型的性能方面有了显著的进步，超过了之前版本的表现。

这些工具宣布在12月4日并现已全球可用，服务于各种应用，从学术研究到行业使用。

更新的目标是满足对于在复杂和多样化的大型语言模型中更好的训练性能的不断增长的需求。他们关注于加速训练过程、提高效率和扩展模型能力，这对于需要大量计算的模型来说至关重要。

增强功能包括混合精度实现、优化的激活函数和提高通信效率。H200 GPU达到了每个GPU 836 TFLOPS的性能，显著增加了训练吞吐量。

引入了全分片数据并行性技术（Fully Sharded Data Parallelism）以及混合专家模型架构（Mixture of Experts architecture），优化了模型训练和容量。采用TensorRT-LLM增强了基于人类反馈的强化学习，支持更大的模型并提升了性能。

对于有兴趣的人，NVIDIA将NeMo框架以开源库的形式提供，以及在NGC上提供容器，并作为NVIDIA AI企业版的一部分。NVIDIA还提供了额外的资源，如GTC会议、网络研讨会和SDK，以进一步与NVIDIA的AI工具进行互动。

文章来源：https://analyticsindiamag.com/nvidia-unveils-enhanced-nemo-framework-improves-llm-training-on-h200-gpu/

标签：

NVIDIA LLM NeMo框架

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇微软Copilot即将融入GPT-4 Turbo与DALL-E 3等新技术

下一篇 Meta与IBM成立联盟，以维护AI未来的开放性

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来

每个人都应该知道的48个AI术语

openwebtext glue shunk031/JGLUE piqa wikitext sciq EleutherAI/lambada_openai facebook/flores

AI热点

行业学习机器学习人工智能公司板人工智能未来机器人视觉识别

AI工具

更多工具 »

火山写作

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub Copilot

GitHub AI编程工具

Adobe Firefly

Adobe最新推出的AI图片生成工具

文心一格

AI艺术和创意辅助平台

热门企业

更多企业 »

热门职位

更多职位 »

深度学习软件工程师

Maluuba

20000~40000/月

Unity技术经理

Cisco

25000~30000/月深圳市

高级数据分析工程师

PilotAILabs

30000~60000/年深圳市

写评论取消

回复取消