模型:
SaiedAlshahrani/arywiki_mlm
该模型是在未知数据集上基于 进行微调的版本。在评估集上取得以下结果:
需要更多信息
需要更多信息
需要更多信息
训练时使用了以下超参数:
Epoch | Step | Training Loss |
---|---|---|
1 | 35 | 9.561500 |
2 | 70 | 7.946000 |
3 | 105 | 7.420400 |
4 | 140 | 7.197800 |
5 | 175 | 7.174400 |
Train Runtime | Train Samples Per Second | Train Steps Per Second | Total Flos | Train Loss | Epoch |
---|---|---|---|---|---|
192.684800 | 121.260000 | 0.960000 | 774708261150720.000000 | 7.812142 | 5.000000 |