模型:

sanchit-gandhi/whisper-medium-fleurs-lang-id

英文

Whisper Medium FLEURS 语言识别模型

该模型是在 google/xtreme_s 数据集的 FLEURS subset 上进行微调的版本。它在评估集上取得以下结果:

  • 损失:0.8413
  • 准确率:0.8805

要复现此运行,请在 run.sh 中执行以下命令。

模型描述

需要更多信息

预期用途和限制

需要更多信息

训练和评估数据

需要更多信息

训练过程

训练超参数

在训练过程中使用了以下超参数:

  • 学习率:3e-05
  • 训练批次大小:16
  • 评估批次大小:32
  • 种子:0
  • 分布式类型:多GPU
  • 梯度累积步数:2
  • 总训练批次大小:32
  • 优化器:Adam(β1=0.9,β2=0.999,ε=1e-08)
  • 学习率调度器类型:线性
  • 学习率调度器预热比例:0.1
  • 训练周期数:3.0

训练结果

Training Loss Epoch Step Validation Loss Accuracy
0.0152 1.0 8494 0.9087 0.8431
0.0003 2.0 16988 1.0059 0.8460
0.0 3.0 25482 0.8413 0.8805

框架版本

  • Transformers 4.27.0.dev0
  • Pytorch 1.13.1
  • Datasets 2.9.0
  • Tokenizers 0.13.2