NVIDIA发布TensorRT 4，极大加速神经机器翻译

登录注册

资讯

学习

基础知识理论实践学习教程

企业招聘

下载

模型数据集

AI工具箱

企业服务

EVA 智能HR 视频AI

ChatGPT 人工智能应用人工智能未来计算机视觉

热门新闻

行业人工智能

为什么数据污染对LLM来说是一个大问题

机器人康奈尔大学

康奈尔大学推出新的社交机器人，更柔软，更人性化

行业人工智能

所以，能动手就别吵吵了

常用工具

火山写作

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub Copilot

GitHub AI编程工具

Adobe Firefly

Adobe最新推出的AI图片生成工具

文心一格

AI艺术和创意辅助平台

您尚未登录账户

请先登录您的atyun账户，方可使用该功能

仅限企业账户使用

该功能仅限企业账号使用，开通企业账号可享受更多服务，是否现在注册企业账号？

立即注册企业账号

暂不需要

您的企业账号申请正在审核中

审核通过后即可使用此功能，请耐心等待~

2018年07月19日由浅浅发表 346719 0

NVIDIA发布了TensorRT 4，其新功能可加速GPU上神经机器翻译（NMT）应用的推断。

神经机器翻译为大量消费应用提供基于AI的文本翻译，包括网站，道路标志，外语字幕等。

TensorRT是NVIDIA的可编程推理加速器，可帮助优化和生成运行时引擎，以便将深度学习推理应用程序部署到生产环境中。谷歌的神经机器翻译（GNMT）模型与仅使用CPU的平台相比，使用TensorRT在Tesla V100 GPU上的推理速度提高了60倍。

新的TensorRT 4版本支持新的RNN层，如Batch MatrixMultiply，Constant，Gather，RaggedSoftMax，Reduce，RNNv2和TopK。这些层允许应用程序开发人员使用TensorRT轻松加速NMT模型中计算密集程度最高的部分。

NVIDIA发布TensorRT 4，极大加速神经机器翻译

NMT详细示例图。编码器、发电机和波束调整作为三个TensorRT引擎。在橙色缓冲区中，由用户分配。在GPU和CPU上分别实现绿色和蓝色的层。

在性能方面，当在数据写入器基准测试组件上测试光束搜索时，系统在batch= 1的推理期间执行的速度比仅用CPU快170倍，比batch= 64的速度快100倍。

NVIDIA的可编程推理加速器TensorRT帮助优化和生成运行时引擎，将深度学习推理应用部署到生产环境中。

与只使用cpu的平台相比，GNMT模型在特斯拉V100 GPU上使用TensorRT的速度更快。

标签：

行业算量英伟达NVIDIA

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇福布斯与英特尔公司合作推出刊物Forbes AI，围绕AI进行深度探讨

下一篇《中国企业家》杂志专访追一科技CEO吴悦：AI落地是件苦差事

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来