该模型是在GLUE数据集上对 roberta-large 进行微调的版本。在评估集上实现以下结果:
需要更多信息
需要更多信息
需要更多信息
训练时使用了以下超参数:
Training Loss | Epoch | Step | Validation Loss | Accuracy |
---|---|---|---|---|
0.3688 | 1.0 | 264 | 0.1444 | 0.9564 |
0.1529 | 2.0 | 528 | 0.1502 | 0.9518 |
0.107 | 3.0 | 792 | 0.1388 | 0.9530 |
0.0666 | 4.0 | 1056 | 0.1400 | 0.9644 |