英文

Whisper Small PL

此模型是在Common Voice 11.0数据集上对 openai/whisper-medium 进行微调的版本。它在评估集上达到以下结果:

  • 损失:0.3739
  • Wer:8.5898

模型描述

需要更多信息

预期用途和限制

需要更多信息

训练和评估数据

需要更多信息

训练过程

训练超参数

训练过程中使用了以下超参数:

  • 学习率:1e-05
  • 训练批次大小:32
  • 评估批次大小:16
  • 种子:42
  • 优化器:Adam,beta=(0.9, 0.999),epsilon=1e-08
  • lr_scheduler_type:linear
  • lr_scheduler_warmup_steps:500
  • 训练步数:5000
  • 混合精度训练:Native AMP

训练结果

Training Loss Epoch Step Validation Loss Wer
0.0474 1.1 1000 0.2561 9.4612
0.0119 3.09 2000 0.2901 8.9726
0.0045 5.08 3000 0.3151 8.8870
0.0007 7.07 4000 0.4218 8.6032
0.0005 9.07 5000 0.3739 8.5898

评估结果

在测试不同的波兰ASR数据集(划分:测试)时,该模型实现了以下结果:

Dataset WER WER unnormalized CER MER
common_voice_11_0 8.85 21.75 2.63 8.76

框架版本

  • Transformers 4.26.0.dev0
  • Pytorch 1.13.0+cu117
  • Datasets 2.7.1.dev0
  • Tokenizers 0.13.2