AWS为文本语音转录平台Amazon Transcribe更新100种语言和新功能

2023年11月28日由 neo 发表 435 0

AWS为其Amazon Transcribe产品增加了新的语言，为100种语言提供了基于生成式AI的转录，以及为客户提供了一系列新的AI能力。

QQ截图20231128140324

在AWS re:Invent活动上宣布，Amazon Transcribe现在可以识别更多的口语语言，并启动一个呼叫转录。AWS的客户使用Transcribe来为他们在AWS云上的应用添加语音到文本的功能。

该公司在一篇博客文章中说，Transcribe在“来自100多种语言的数百万小时的未标注的音频数据”上进行了训练，并使用自监督的算法来学习不同语言和口音中的人类语音模式。AWS说，它确保了一些语言在训练数据中没有过度代表，以确保使用较少的语言能够像更频繁使用的语言一样准确。

在2022年底，Amazon Transcribe支持79种语言。

根据AWS的说法，Amazon Transcribe在许多语言上的准确率在20%到50%之间。它还提供了自动标点、自定义词汇、自动语言识别和自定义词汇过滤器。它可以识别音频和视频格式中的语音，以及嘈杂的环境。

随着更好的语言识别，AWS说，Amazon Transcribe的进步也渗透到了其呼叫分析平台的更好的准确性，这是其联系中心客户经常使用的。Amazon Transcribe Call Analytics，现在也由生成式AI模型驱动，可以总结代理和客户之间的互动。AWS说，这减少了创建报告的后呼叫工作，而且经理可以快速阅读信息，而不需要浏览整个转录。

当然，AWS并不是唯一一个提供AI转录服务的公司。Otter一直在为消费者和企业提供AI转录，并在6月发布了一个摘要工具。虽然不完全相同，但Meta宣布它正在开发一个基于生成式AI的翻译模型，可以识别近100种口语语言。

AWS还为其Amazon Personalization产品增加了额外的能力，该产品允许客户向客户提供产品或显示推荐，就像流媒体服务可以根据以前的活动建议新节目一样。AWS增加了内容生成，它将为他们编写标题或电子邮件主题行，以主题上地连接推荐列表。

文章来源：https://www.theverge.com/2023/11/27/23978822/aws-transcription-amazon-generative-ai

标签：

AWS

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 NVIDIA帮助富士康释放其电动汽车雄心

下一篇 Caylent推出MeteorAI，加快生成式AI解决方案的周期

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来