这是用于分类俄语句子情绪的 cointegrated/rubert-tiny2 模型进行了微调。这个任务是多标签分类,因为一个句子可以包含多个情绪。
根据Sboev等人在 "Data-Driven Model for Emotion Detection in Russian Texts" 论文中描述的模型。
该模型使用Adam优化器进行了40个epochs的训练,学习率为1e-5,批大小为64 in this notebook 。
在测试数据集上预测概率的质量如下:
label | no emotion | joy | sadness | surprise | fear | anger | mean | mean (emotions) |
---|---|---|---|---|---|---|---|---|
AUC | 0.9286 | 0.9512 | 0.9564 | 0.8908 | 0.8955 | 0.7511 | 0.8956 | 0.8890 |
F1 micro | 0.8624 | 0.9389 | 0.9362 | 0.9469 | 0.9575 | 0.9261 | 0.9280 | 0.9411 |
F1 macro | 0.8562 | 0.8962 | 0.9017 | 0.8366 | 0.8359 | 0.6820 | 0.8348 | 0.8305 |