英文

大规模多语言语音 (MMS) - 3亿

Facebook的MMS模型拥有3亿个参数。

MMS是Facebook AI的大规模多语言预训练语音模型。该模型在超过1,400种语言的约500,000小时的语音数据上进行了预训练。

当使用该模型时,请确保语音输入采样率为16kHz。

注意:该模型应在下游任务(如自动语音识别、翻译或分类)上进行微调。有关ASR的更多信息,请查看**如何微调**部分或 this blog

目录

  • 如何微调
  • 模型详情
  • 附加链接

如何微调

即将推出...

模型详情

  • 开发人员: Vineel Pratap等

  • 模型类型: 多语言自动语音识别模型

  • 语言: 1000+种语言

  • 许可: CC-BY-NC 4.0许可协议

  • 参数数量:3亿个

  • 引用:

    @article{pratap2023mms,
      title={Scaling Speech Technology to 1,000+ Languages},
      author={Vineel Pratap and Andros Tjandra and Bowen Shi and Paden Tomasello and Arun Babu and Sayani Kundu and Ali Elkahky and Zhaoheng Ni and Apoorv Vyas and Maryam Fazel-Zarandi and Alexei Baevski and Yossi Adi and Xiaohui Zhang and Wei-Ning Hsu and Alexis Conneau and Michael Auli},
    journal={arXiv},
    year={2023}
    }
    

附加链接