AWS升级Transcribe服务：AI能力增强，支持100+语言

2023年11月29日由 daydream 发表 426 0

亚马逊网络服务（Amazon Web Services，AWS）最近宣布了其语音转录服务Amazon Transcribe的一项重大升级，该服务由下一代语音基础模型提供支持。这次更新显著扩大了Transcribe的语音识别功能，支持100多种语言，同时在准确性方面取得了实质性的提高，并整合了一系列AI驱动的能力。

微信截图_20231129134359

更新的核心是一个由数十亿参数构成的生成式AI模型，该模型经过针对多种语言的数百万小时语音数据的训练。这个模型的算法使其能够学习普遍的语音模式，更好地识别多样的口音和嘈杂的环境。

因此，Transcribe现在承诺对于大多数语言的识别准确率提高了20-50%，对于电信语音这种众所周知难以处理以及数据稀缺的领域，准确率甚至提高了30-70%。语言支持的扩大和语音识别质量的提升为不同行业的新用例解锁了潜力。

紧急呼叫平台Carbyne计划利用Transcribe广泛的多语言能力来扩大对911和紧急响应的访问权限。Carbyne的首席技术官Alex Dizengof解释说，这将使他们的翻译功能能够更好地服务于非英语母语者，支持他们的使命"每个人都很重要"。

其中一个突出特点是Amazon Transcribe Call Analytics中的生成式呼叫摘要功能。这项功能将整个互动简化为简洁的摘要，从而大大减轻了代理的通话后工作负担，并允许管理者快速掌握互动的上下文。

微信截图_20231129134421

新的自动语音识别设计考虑到了易用性、定制性、用户安全和隐私。它包括自动标点、自定义词汇、自动语言识别、说话者分离、词级别的置信度得分和自定义词汇过滤等功能。

微信截图_20231129134439

其他应用包括媒体和内容公司的自动字幕、在联系中心从客户通话记录中挖掘见解等。实际上，任何处理大量口语音频的组织都可以受益。

重要的是，这些升级会自动应用到所有Amazon Transcribe客户，而无需迁移。API端点、输入参数和后端流程保持不变。

其他新功能提供了可定制的特性，以满足用户的安全、隐私和可访问性需求，如像自动语言识别、自定义词汇过滤和说话者标记。

文章来源：https://www.maginative.com/article/aws-unveils-major-update-to-amazon-transcribe-with-ai-powered-speech-recognition-for-over-100-languages/

标签：

AWS 语音 Transcribe

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 Transformers.js：全面支持文本至语音功能

下一篇 Meta AI推出Audiobox：支持语音文本生成的新型AI音频模型

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来