模型:

anton-l/sew-mid-100k-ft-keyword-spotting

英文

sew-mid-100k-ft-keyword-spotting

这个模型是在超级数据集上对 asapp/sew-mid-100k 进行微调后的版本。它在评估集上取得了以下结果:

  • Loss(损失):0.0975
  • Accuracy(准确率):0.9757

模型描述

需要更多信息

预期用途和限制

需要更多信息

训练和评估数据

需要更多信息

训练过程

训练超参数

训练时使用了以下超参数:

  • 学习率(learning_rate):3e-05
  • 训练批大小(train_batch_size):32
  • 评估批大小(eval_batch_size):32
  • 种子(seed):0
  • 梯度累积步数(gradient_accumulation_steps):4
  • 总训练批大小(total_train_batch_size):128
  • 优化器(optimizer):Adam,beta 值为 (0.9, 0.999),epsilon 值为 1e-08
  • 学习率调度器类型(lr_scheduler_type):linear
  • 学习率热身比例(lr_scheduler_warmup_ratio):0.1
  • 训练周期数(num_epochs):5.0
  • 混合精度训练(mixed_precision_training):Native AMP

训练结果

Training Loss Epoch Step Validation Loss Accuracy
0.5999 1.0 399 0.2262 0.9635
0.4271 2.0 798 0.1230 0.9697
0.3778 3.0 1197 0.1052 0.9731
0.3227 4.0 1596 0.0975 0.9757
0.3081 5.0 1995 0.0962 0.9753

框架版本

  • Transformers 4.12.0.dev0
  • Pytorch 1.9.1+cu111
  • Datasets 1.14.0
  • Tokenizers 0.10.3