模型:
StevenLimcorn/indonesian-roberta-base-emotion-classifier
Indo RoBERTa情感分类器是基于 Indo-roberta 模型的情感分类器。它是在 IndoNLU EmoT 数据集上训练的。该模型使用了 Indo-roberta 并进行了迁移学习,成为了一个情感分类器模型。根据 IndoNLU bencmark 的结果,该模型的f1-macro为72.05%,准确率为71.81%,精确度为72.47%,召回率为71.94%。
该模型在学习率2e-5的情况下进行了7个epoch的训练,达到了如下所示的不同指标。
Epoch | Training Loss | Validation Loss | Accuracy | F1 | Precision | Recall |
---|---|---|---|---|---|---|
1 | 1.300700 | 1.005149 | 0.622727 | 0.601846 | 0.640845 | 0.611144 |
2 | 0.806300 | 0.841953 | 0.686364 | 0.694096 | 0.701984 | 0.696657 |
3 | 0.591900 | 0.796794 | 0.686364 | 0.696573 | 0.707520 | 0.691671 |
4 | 0.441200 | 0.782094 | 0.722727 | 0.724359 | 0.725985 | 0.730229 |
5 | 0.334700 | 0.809931 | 0.711364 | 0.720550 | 0.718318 | 0.724608 |
6 | 0.268400 | 0.812771 | 0.718182 | 0.724192 | 0.721222 | 0.729195 |
7 | 0.226000 | 0.828461 | 0.725000 | 0.733625 | 0.731709 | 0.735800 |
from transformers import pipeline pretrained_name = "StevenLimcorn/indonesian-roberta-base-emotion-classifier" nlp = pipeline( "sentiment-analysis", model=pretrained_name, tokenizer=pretrained_name ) nlp("Hal-hal baik akan datang.")
请考虑到来自预训练的RoBERTa模型和EmoT数据集中可能传递给此模型结果的偏见。
Indonesian RoBERTa基础情感分类器由 Steven Limcorn 进行训练和评估。所有的计算和开发都在Google Colaboratory上使用他们的免费GPU资源完成。
如果使用,请引用
@misc {steven_limcorn_2023, author = { {Steven Limcorn} }, title = { indonesian-roberta-base-emotion-classifier (Revision e8a9cb9) }, year = 2023, url = { https://huggingface.co/StevenLimcorn/indonesian-roberta-base-emotion-classifier }, doi = { 10.57967/hf/0681 }, publisher = { Hugging Face } }