deberta_squadnewsqa
该模型是在Squad_v2和NewsQA数据集上经过微调的版本。在评估集上取得以下结果:
模型描述
需要更多信息
预期用途和限制
需要更多信息
训练和评估数据
需要更多信息
训练过程
训练超参数
训练时使用了以下超参数:
- 学习率:2e-05
- 训练批次大小:8
- 评估批次大小:8
- 种子:42
- 优化器:Adam,beta值为(0.9,0.999),epsilon值为1e-08
- 学习率调度器类型:线性
- 训练轮数:1
训练结果
Training Loss
|
Epoch
|
Step
|
Validation Loss
|
1.0355
|
1.0
|
14875
|
0.9648
|
框架版本
- Transformers 4.28.0
- Pytorch 2.0.0
- Datasets 2.12.0
- Tokenizers 0.13.3