英文

大规模多语种语音(MMS)- 10亿

Facebook的MMS具有10亿个参数。

MMS是Facebook AI的大规模多语种预训练语音模型("MMS")。它是在超过1,400种语言的约500,000小时语音数据上进行预训练的。

使用该模型时,请确保你的语音输入采样率为16kHz。

注意:这个模型应该在下游任务(如自动语音识别、翻译或分类)上进行微调。详情请查看**如何进行微调部分或 this blog 以获取更多关于ASR的信息。

目录

  • 如何进行微调
  • 模型详情
  • 额外链接

如何进行微调

即将推出...

模型详情

  • 开发者:Vineel Pratap等

  • 模型类型:多语种自动语音识别模型

  • 语言:1000+种语言

  • 许可证:CC-BY-NC 4.0许可

  • 参数数量:10亿

  • 引用方式:

    @article{pratap2023mms,
      title={Scaling Speech Technology to 1,000+ Languages},
      author={Vineel Pratap and Andros Tjandra and Bowen Shi and Paden Tomasello and Arun Babu and Sayani Kundu and Ali Elkahky and Zhaoheng Ni and Apoorv Vyas and Maryam Fazel-Zarandi and Alexei Baevski and Yossi Adi and Xiaohui Zhang and Wei-Ning Hsu and Alexis Conneau and Michael Auli},
    journal={arXiv},
    year={2023}
    }
    

额外链接