英文

Whisper Tiny Indonesian

该模型是基于mozilla-foundation/common_voice_11_0,magic_data,titml和google/fleurs数据集对 openai/whisper-tiny 进行微调的版本。它在评估集上达到以下结果:

  • Loss(损失):0.2409
  • Wer(词错误率):18.2837

模型描述

需要更多信息

预期用途与限制

需要更多信息

训练和评估数据

需要更多信息

训练过程

训练超参数

训练过程中使用了以下超参数:

  • 学习率:1e-05
  • 训练批次大小:32
  • 评估批次大小:16
  • 种子:42
  • 优化器:Adam(参数为betas=(0.9,0.999)和epsilon=1e-08)
  • 学习率调度器类型:线性
  • 学习率调度器预热步数:500
  • 训练步数:10000
  • 混合精度训练:Native AMP

训练结果

Training Loss Epoch Step Validation Loss Wer
0.4103 0.66 1000 0.3802 27.0497
0.2682 1.32 2000 0.3223 22.9365
0.2381 1.99 3000 0.2884 20.8245
0.1606 2.65 4000 0.2727 20.1928
0.1246 3.31 5000 0.2596 18.9984
0.1344 3.97 6000 0.2482 18.7540
0.0975 4.63 7000 0.2471 18.6388
0.0916 5.29 8000 0.2436 18.9615
0.0854 5.96 9000 0.2413 18.3114
0.0812 6.62 10000 0.2409 18.2837

框架版本

  • Transformers 4.26.0.dev0
  • Pytorch 1.13.0+cu117
  • Datasets 2.7.1.dev0
  • Tokenizers 0.13.2