模型:

MilaNLProc/feel-it-italian-emotion

英文

FEEL-IT:意大利语情感与情绪分类

FEEL-IT Python软件包

您可以找到使用此模型进行意大利语情感和情绪分类的软件包,该软件包旨在为HuggingFace模型提供非常简单的接口。

许可证

用户应参考 following license

摘要

情感分析是一项常见任务,用于了解人们在线上的反应。然而,我们常常需要更细致的信息:是因为用户生气还是因为他们伤心而导致帖子消极?

对于这两个任务,已经提出了大量的方法。然而,至少对于意大利语而言,它们都只处理其中一个任务。我们引入了FEEL-IT,这是一个新的意大利语推特帖子基准语料库,带有四种基本情绪的注释:愤怒、恐惧、喜悦、悲伤。通过将它们合并,我们也可以进行情感分析。我们使用基准数据集对我们的语料库进行评估,用于两项情感和情绪分类,获得了有竞争力的结果。

我们发布了一个 open-source Python library ,因此研究人员可以使用在FEEL-IT上训练的模型来推断意大利文本中的情感和情绪。

Model Download
feel-it-italian-sentiment 1235321
feel-it-italian-emotion 1236321

模型

feel-it-italian-emotion模型对意大利文进行情绪分类(喜悦、恐惧、愤怒、悲伤)。我们在我们的新数据集(即FEEL-IT)上对 UmBERTo model 进行了微调,获得了在不同基准语料库上的最新性能。

数据

我们的数据是通过对来自各种话题的推文进行注释而收集的。总共,我们有2037个带有情感标签的推文。更多细节可以在我们的论文( https://aclanthology.org/2021.wassa-1.8/ )中找到。

性能

我们使用 MultiEmotions-It 评估我们的性能。该数据集在话题多样性和考虑的社交媒体方面与FEEL-IT有所不同(即YouTube和Facebook)。我们只考虑FEEL-IT中存在的情感子集。为了提供一个参考点,我们还展示了最常见类别(MFC)基线结果。结果显示,在FEEL-IT上的训练带来了稳定的性能,即使在不同情境的数据集上也是如此。

Training Dataset Macro-F1 Accuracy
MFC 0.20 0.64
FEEL-IT 0.57 0.73

用法

from transformers import pipeline
classifier = pipeline("text-classification",model='MilaNLProc/feel-it-italian-emotion',top_k=2)
prediction = classifier("Oggi sono proprio contento!")
print(prediction)

引用

如果您在项目中使用此模型,请使用以下bibtex条目:

@inproceedings{bianchi2021feel,
    title = {{"FEEL-IT: Emotion and Sentiment Classification for the Italian Language"}},
    author = "Bianchi, Federico and Nozza, Debora and Hovy, Dirk",
    booktitle = "Proceedings of the 11th Workshop on Computational Approaches to Subjectivity, Sentiment and Social Media Analysis",
    year = "2021",
    publisher = "Association for Computational Linguistics",
}