初创公司BabbleLabs用AI来增强语音
2018年07月24日 由 浅浅 发表
899558
0
总部位于加利福尼亚的创业公司BabbleLabs正致力于提高语音质量,包括准确性和个性化。 该公司最近宣布推出一款新的深度学习产品,该产品依靠端到端的GPU来执行语音增强,降噪以及标准视频或音频的音频和视频处理等任务。
BabbleLabs首席执行官Chris Rowen 表示,“我们的第一款产品Clear Cloud将业界领先的AI计算技术推向市场,这是我们路线图中众多产品中的第一个,它将有助于将语音增强技术用于实际环境中使用的日常应用。”
团队在谷歌云上使用NVIDIA Tesla V100 GPU,使用cudnn加速的TensorFlow深度学习框架,用数十万小时独特而嘈杂的演讲中训练了神经网络。
为了推断,该公司在培训过程中使用的是相同的NVIDIA Tesla V100 GPU。神经网络提供了令人印象深刻的结果,使这项技术能够应用于广泛的词汇、口音和语言。
[video width="640" height="360" mp4="https://www.atyun.com/uploadfile/2018/07/Original_-Speak-Your-Mind-by-Raul.mp4"][/video]
增强声音前
[video width="640" height="360" mp4="https://www.atyun.com/uploadfile/2018/07/Enhanced_-Speak-Your-Mind-by-Raul.mp4"][/video]
增强声音后
Rowen指出,“GPU的绝对性能,加上它们在深度学习编程环境中的强大支持,使我们能够以更低的成本训练更大,更复杂的网络,并以低成本进行商业化部署,GPU是BabbleLabs提供世界上最好的语音增强技术的关键因素。”
该公司最近发布了一个详细的博客,解释了他们使用GPU和深度学习的原因。此产品页面提供用于语音增强的Clear cloud API:babblelabs.com/products/clear-cloud/