假设播客人只需按下一个开关,就可以立即使用另一种语言说话,会是怎样呢?这就是Spotify新推出的基于AI的语音翻译功能的前提,它使用播客人的声音将播客翻译成其他语言。
该公司已经与一些播客人合作,使用其新工具将他们的英语节目翻译成西班牙语,并计划在未来几周内推出法语和德语翻译。最初一批节目将来自一些大牌人物,包括Dax Shepard、Monica Padman、Lex Fridman、Bill Simmons和Steven Bartlett。Spotify计划扩大合作团队,包括“The Ringer”公司的“The Rewatchables”节目以及Trevor Noah的即将推出的节目。
翻译功能的核心是OpenAI的语音转录工具Whisper,它既可以转录英语演讲,也可以将其他语言翻译成英语。但是Spotify的工具不仅限于语音到文本的翻译——该功能能够将播客翻译成不同的语言,并以播客人自己声音的合成版本再现。
Spotify的个性化副总裁Ziad Sultan在一份声明中表示:“通过匹配创作者自己的声音,语音翻译功能使全球听众能够以比以往更真实的方式发现新播客并受到其启发。”
OpenAI可能也参与了新功能的声音复制部分。这家AI公司今天发布了一些公告,其中包括推出一种工具,可以仅凭文本和几秒钟的示例语音创建“类似人类的音频”。OpenAI表示,由于安全和隐私方面的担忧,它有意限制该工具的广泛使用范围。
这可能也是为什么Spotify表示,目前只在“一小部分”播客人中测试翻译技术的原因。该公司没有详细说明计划将该工具推广到哪里,或者何时可以期待扩大规模。