英文

flan-t5-base-samsum

这个模型是在samsum数据集上从 google/flan-t5-base 进行微调得到的。它在评估集上达到了以下结果:

  • 损失:1.3716
  • Rouge1:47.2358
  • Rouge2:23.5135
  • Rougel:39.6266
  • Rougelsum:43.3458
  • 生成长度:17.3907

模型描述

需要更多的信息

预期用途和限制

需要更多的信息

训练和评估数据

需要更多的信息

训练过程

训练超参数

在训练过程中使用了以下超参数:

  • 学习率:5e-05
  • 训练批大小:8
  • 评估批大小:8
  • 种子:42
  • 优化器:Adam,beta值为(0.9,0.999),epsilon为1e-08
  • lr_scheduler_type:线性
  • 训练轮数:5

训练结果

Training Loss Epoch Step Validation Loss Rouge1 Rouge2 Rougel Rougelsum Gen Len
1.4379 1.0 1842 1.3805 47.1075 23.531 39.6919 43.549 17.1197
1.3559 2.0 3684 1.3716 47.2358 23.5135 39.6266 43.3458 17.3907
1.2783 3.0 5526 1.3721 47.4581 23.7339 39.7726 43.4568 17.1832
1.2378 4.0 7368 1.3757 47.8557 24.0593 40.2324 44.0085 17.3053
1.1983 5.0 9210 1.3751 47.8156 24.0038 40.2169 43.8918 17.3040

框架版本

  • Transformers 4.25.1
  • Pytorch 1.12.1+cu113
  • Datasets 2.8.0
  • Tokenizers 0.12.1