该模型是 facebook/wav2vec2-xls-r-300m 在 FTSpeech dataset 数据集上的微调版本,该数据集包含来自丹麦议会的1800小时的演讲转录。
该模型实现了以下WER分数(越低越好):
Dataset | WER without LM | WER with 5-gram LM |
---|---|---|
1232321 | 20.48 | 17.91 |
1233321 | 15.46 | 13.84 |
使用该模型需要遵守 this license from the Danish Parliament 的规定。