初创公司BabbleLabs用AI来增强语音

登录注册

资讯

学习

基础知识理论实践学习教程

企业招聘

下载

模型数据集

AI工具箱

企业服务

EVA 智能HR 视频AI

ChatGPT 人工智能应用人工智能未来计算机视觉

热门新闻

行业人工智能

为什么数据污染对LLM来说是一个大问题

机器人康奈尔大学

康奈尔大学推出新的社交机器人，更柔软，更人性化

行业人工智能

所以，能动手就别吵吵了

常用工具

火山写作

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub Copilot

GitHub AI编程工具

Adobe Firefly

Adobe最新推出的AI图片生成工具

文心一格

AI艺术和创意辅助平台

您尚未登录账户

请先登录您的atyun账户，方可使用该功能

仅限企业账户使用

该功能仅限企业账号使用，开通企业账号可享受更多服务，是否现在注册企业账号？

立即注册企业账号

暂不需要

您的企业账号申请正在审核中

审核通过后即可使用此功能，请耐心等待~

2018年07月24日由浅浅发表 899655 0

总部位于加利福尼亚的创业公司BabbleLabs正致力于提高语音质量，包括准确性和个性化。该公司最近宣布推出一款新的深度学习产品，该产品依靠端到端的GPU来执行语音增强，降噪以及标准视频或音频的音频和视频处理等任务。

BabbleLabs首席执行官Chris Rowen 表示，“我们的第一款产品Clear Cloud将业界领先的AI计算技术推向市场，这是我们路线图中众多产品中的第一个，它将有助于将语音增强技术用于实际环境中使用的日常应用。”

团队在谷歌云上使用NVIDIA Tesla V100 GPU，使用cudnn加速的TensorFlow深度学习框架，用数十万小时独特而嘈杂的演讲中训练了神经网络。

为了推断，该公司在培训过程中使用的是相同的NVIDIA Tesla V100 GPU。神经网络提供了令人印象深刻的结果，使这项技术能够应用于广泛的词汇、口音和语言。

[video width="640" height="360" mp4="https://www.atyun.com/uploadfile/2018/07/Original_-Speak-Your-Mind-by-Raul.mp4"][/video]

增强声音前

[video width="640" height="360" mp4="https://www.atyun.com/uploadfile/2018/07/Enhanced_-Speak-Your-Mind-by-Raul.mp4"][/video]

增强声音后

Rowen指出，“GPU的绝对性能，加上它们在深度学习编程环境中的强大支持，使我们能够以更低的成本训练更大，更复杂的网络，并以低成本进行商业化部署，GPU是BabbleLabs提供世界上最好的语音增强技术的关键因素。”

该公司最近发布了一个详细的博客，解释了他们使用GPU和深度学习的原因。此产品页面提供用于语音增强的Clear cloud API：babblelabs.com/products/clear-cloud/

标签：

语音识别自然语言处理NLP 人工智能应用

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 AI算法可以通过声音片段分辨出鸟类

下一篇亚马逊申请专利：机器学习检测并修改口音以减轻交流障碍

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来