模型:

MilaNLProc/feel-it-italian-sentiment

英文

FEEL-IT: 意大利语情感和情绪分类

FEEL-IT Python 包

您可以找到使用此模型进行情感和情绪分类的软件包,它旨在成为 HuggingFace 模型的简单接口。

许可

用户应参考 following license

摘要

情感分析是一项常见任务,用于理解人们在网上的反应。然而,我们经常需要更细致的信息:帖子是否消极是因为用户生气还是因为他们悲伤?

已经提出了各种方法来解决这两个任务。然而,至少对于意大利语而言,它们仅同时处理其中一个任务。我们引入了 FEEL-IT,一种用四种基本情绪(愤怒、恐惧、喜悦、悲伤)注释的意大利语推特帖子的新颖基准语料库。通过合并它们,我们还可以进行情感分析。我们在情感和情绪分类的基准数据集上评估我们的语料库,并获得具有竞争力的结果。

我们发布了一个 open-source Python library ,以便研究人员可以使用在 FEEL-IT 上训练的模型从意大利文本中推断出情感和情绪。

模型

feel-it-italian-sentiment 模型在意大利语上进行情感分析。我们在新数据集 FEEL-IT 上对 UmBERTo model 进行了精调,获得了在不同基准语料库上的最新性能。

数据

我们的数据是通过注释来自各种主题的推文收集而来的。总共有 2037 条带有情绪标签的推文。更多详细信息请参阅我们的论文( https://aclanthology.org/2021.wassa-1.8/ )。

性能

我们使用 SENTIPOLC16 Evalita 进行性能评估。我们将 FEEL-IT 类别折叠为两个类别,将喜悦映射到正类别,将愤怒、恐惧和悲伤映射到负类别。我们比较了在 FEEL-IT、SENTIPOLC16 或两者上训练并在 SENTIPOLC16 测试集上进行测试的三种不同实验配置。结果显示,使用 FEEL-IT 进行训练可以在 SENTIPOLC16 测试集上提供比 SENTIPOLC16 训练集更好的结果。

用法

from transformers import pipeline
classifier = pipeline("text-classification",model='MilaNLProc/feel-it-italian-sentiment',top_k=2)
prediction = classifier("Oggi sono proprio contento!")
print(prediction)

引用

如果您在项目中使用此模型,请使用以下 bibtex 条目进行引用:

@inproceedings{bianchi2021feel,
    title = {{"FEEL-IT: Emotion and Sentiment Classification for the Italian Language"}},
    author = "Bianchi, Federico and Nozza, Debora and Hovy, Dirk",
    booktitle = "Proceedings of the 11th Workshop on Computational Approaches to Subjectivity, Sentiment and Social Media Analysis",
    year = "2021",
    publisher = "Association for Computational Linguistics",
}