AWS为其Amazon Transcribe产品增加了新的语言,为100种语言提供了基于生成式AI的转录,以及为客户提供了一系列新的AI能力。
在AWS re:Invent活动上宣布,Amazon Transcribe现在可以识别更多的口语语言,并启动一个呼叫转录。AWS的客户使用Transcribe来为他们在AWS云上的应用添加语音到文本的功能。
该公司在一篇博客文章中说,Transcribe在“来自100多种语言的数百万小时的未标注的音频数据”上进行了训练,并使用自监督的算法来学习不同语言和口音中的人类语音模式。AWS说,它确保了一些语言在训练数据中没有过度代表,以确保使用较少的语言能够像更频繁使用的语言一样准确。
在2022年底,Amazon Transcribe支持79种语言。
根据AWS的说法,Amazon Transcribe在许多语言上的准确率在20%到50%之间。它还提供了自动标点、自定义词汇、自动语言识别和自定义词汇过滤器。它可以识别音频和视频格式中的语音,以及嘈杂的环境。
随着更好的语言识别,AWS说,Amazon Transcribe的进步也渗透到了其呼叫分析平台的更好的准确性,这是其联系中心客户经常使用的。Amazon Transcribe Call Analytics,现在也由生成式AI模型驱动,可以总结代理和客户之间的互动。AWS说,这减少了创建报告的后呼叫工作,而且经理可以快速阅读信息,而不需要浏览整个转录。
当然,AWS并不是唯一一个提供AI转录服务的公司。Otter一直在为消费者和企业提供AI转录,并在6月发布了一个摘要工具。虽然不完全相同,但Meta宣布它正在开发一个基于生成式AI的翻译模型,可以识别近100种口语语言。
AWS还为其Amazon Personalization产品增加了额外的能力,该产品允许客户向客户提供产品或显示推荐,就像流媒体服务可以根据以前的活动建议新节目一样。AWS增加了内容生成,它将为他们编写标题或电子邮件主题行,以主题上地连接推荐列表。