模型:
facebook/mms-300m
Facebook的MMS模型拥有3亿个参数。
MMS是Facebook AI的大规模多语言预训练语音模型。该模型在超过1,400种语言的约500,000小时的语音数据上进行了预训练。
当使用该模型时,请确保语音输入采样率为16kHz。
注意:该模型应在下游任务(如自动语音识别、翻译或分类)上进行微调。有关ASR的更多信息,请查看**如何微调**部分或 this blog 。
即将推出...
开发人员: Vineel Pratap等
模型类型: 多语言自动语音识别模型
语言: 1000+种语言
许可: CC-BY-NC 4.0许可协议
参数数量:3亿个
引用:
@article{pratap2023mms, title={Scaling Speech Technology to 1,000+ Languages}, author={Vineel Pratap and Andros Tjandra and Bowen Shi and Paden Tomasello and Arun Babu and Sayani Kundu and Ali Elkahky and Zhaoheng Ni and Apoorv Vyas and Maryam Fazel-Zarandi and Alexei Baevski and Yossi Adi and Xiaohui Zhang and Wei-Ning Hsu and Alexis Conneau and Michael Auli}, journal={arXiv}, year={2023} }