英文

deberta_squadnewsqa

该模型是在Squad_v2和NewsQA数据集上经过微调的版本。在评估集上取得以下结果:

  • 损失值:0.9648

模型描述

需要更多信息

预期用途和限制

需要更多信息

训练和评估数据

需要更多信息

训练过程

训练超参数

训练时使用了以下超参数:

  • 学习率:2e-05
  • 训练批次大小:8
  • 评估批次大小:8
  • 种子:42
  • 优化器:Adam,beta值为(0.9,0.999),epsilon值为1e-08
  • 学习率调度器类型:线性
  • 训练轮数:1

训练结果

Training Loss Epoch Step Validation Loss
1.0355 1.0 14875 0.9648

框架版本

  • Transformers 4.28.0
  • Pytorch 2.0.0
  • Datasets 2.12.0
  • Tokenizers 0.13.3