英文

KostiuchenkoArtem/bart_large_multi_modified

这个模型是在Multi-News数据集上基于 facebook/bart-large-cnn 进行微调得到的。在评估集上取得了以下结果:

  • 训练损失:1.8945
  • 验证损失:2.1223
  • 迭代轮数:1

模型描述

需要更多的信息

用途和限制

需要更多的信息

训练和评估数据

需要更多的信息

训练过程

训练超参数

训练时使用了以下超参数:

  • 优化器:{'name': 'AdamWeightDecay', 'learning_rate': 2e-05, 'decay': 0.0, 'beta_1': 0.9, 'beta_2': 0.999, 'epsilon': 1e-07, 'amsgrad': False, 'weight_decay_rate': 0.01}
  • 训练精度:float32

训练结果

Train Loss Validation Loss Epoch
2.2231 2.1476 0
1.8945 2.1223 1

框架版本

  • Transformers 4.29.2
  • TensorFlow 2.12.0
  • Datasets 2.12.0
  • Tokenizers 0.13.3