模型:

StevenLimcorn/indonesian-roberta-base-emotion-classifier

英文

Indo RoBERTa情感分类器

Indo RoBERTa情感分类器是基于 Indo-roberta 模型的情感分类器。它是在 IndoNLU EmoT 数据集上训练的。该模型使用了 Indo-roberta 并进行了迁移学习,成为了一个情感分类器模型。根据 IndoNLU bencmark 的结果,该模型的f1-macro为72.05%,准确率为71.81%,精确度为72.47%,召回率为71.94%。

模型

该模型在学习率2e-5的情况下进行了7个epoch的训练,达到了如下所示的不同指标。

Epoch Training Loss Validation Loss Accuracy F1 Precision Recall
1 1.300700 1.005149 0.622727 0.601846 0.640845 0.611144
2 0.806300 0.841953 0.686364 0.694096 0.701984 0.696657
3 0.591900 0.796794 0.686364 0.696573 0.707520 0.691671
4 0.441200 0.782094 0.722727 0.724359 0.725985 0.730229
5 0.334700 0.809931 0.711364 0.720550 0.718318 0.724608
6 0.268400 0.812771 0.718182 0.724192 0.721222 0.729195
7 0.226000 0.828461 0.725000 0.733625 0.731709 0.735800

如何使用

作为文本分类器

from transformers import pipeline
pretrained_name = "StevenLimcorn/indonesian-roberta-base-emotion-classifier"
nlp = pipeline(
    "sentiment-analysis",
    model=pretrained_name,
    tokenizer=pretrained_name
)
nlp("Hal-hal baik akan datang.")

免责声明

请考虑到来自预训练的RoBERTa模型和EmoT数据集中可能传递给此模型结果的偏见。

作者

Indonesian RoBERTa基础情感分类器由 Steven Limcorn 进行训练和评估。所有的计算和开发都在Google Colaboratory上使用他们的免费GPU资源完成。

如果使用,请引用

@misc {steven_limcorn_2023,
    author       = { {Steven Limcorn} },
    title        = { indonesian-roberta-base-emotion-classifier (Revision e8a9cb9) },
    year         = 2023,
    url          = { https://huggingface.co/StevenLimcorn/indonesian-roberta-base-emotion-classifier },
    doi          = { 10.57967/hf/0681 },
    publisher    = { Hugging Face }
}