模型:
facebook/mms-1b
Facebook的MMS具有10亿个参数。
MMS是Facebook AI的大规模多语种预训练语音模型("MMS")。它是在超过1,400种语言的约500,000小时语音数据上进行预训练的。
使用该模型时,请确保你的语音输入采样率为16kHz。
注意:这个模型应该在下游任务(如自动语音识别、翻译或分类)上进行微调。详情请查看**如何进行微调部分或 this blog 以获取更多关于ASR的信息。
即将推出...
开发者:Vineel Pratap等
模型类型:多语种自动语音识别模型
语言:1000+种语言
许可证:CC-BY-NC 4.0许可
参数数量:10亿
引用方式:
@article{pratap2023mms, title={Scaling Speech Technology to 1,000+ Languages}, author={Vineel Pratap and Andros Tjandra and Bowen Shi and Paden Tomasello and Arun Babu and Sayani Kundu and Ali Elkahky and Zhaoheng Ni and Apoorv Vyas and Maryam Fazel-Zarandi and Alexei Baevski and Yossi Adi and Xiaohui Zhang and Wei-Ning Hsu and Alexis Conneau and Michael Auli}, journal={arXiv}, year={2023} }