模型:
MilaNLProc/feel-it-italian-emotion
您可以找到使用此模型进行意大利语情感和情绪分类的软件包,该软件包旨在为HuggingFace模型提供非常简单的接口。
用户应参考 following license 。
情感分析是一项常见任务,用于了解人们在线上的反应。然而,我们常常需要更细致的信息:是因为用户生气还是因为他们伤心而导致帖子消极?
对于这两个任务,已经提出了大量的方法。然而,至少对于意大利语而言,它们都只处理其中一个任务。我们引入了FEEL-IT,这是一个新的意大利语推特帖子基准语料库,带有四种基本情绪的注释:愤怒、恐惧、喜悦、悲伤。通过将它们合并,我们也可以进行情感分析。我们使用基准数据集对我们的语料库进行评估,用于两项情感和情绪分类,获得了有竞争力的结果。
我们发布了一个 open-source Python library ,因此研究人员可以使用在FEEL-IT上训练的模型来推断意大利文本中的情感和情绪。
Model | Download |
---|---|
feel-it-italian-sentiment | 1235321 |
feel-it-italian-emotion | 1236321 |
feel-it-italian-emotion模型对意大利文进行情绪分类(喜悦、恐惧、愤怒、悲伤)。我们在我们的新数据集(即FEEL-IT)上对 UmBERTo model 进行了微调,获得了在不同基准语料库上的最新性能。
我们的数据是通过对来自各种话题的推文进行注释而收集的。总共,我们有2037个带有情感标签的推文。更多细节可以在我们的论文( https://aclanthology.org/2021.wassa-1.8/ )中找到。
我们使用 MultiEmotions-It 评估我们的性能。该数据集在话题多样性和考虑的社交媒体方面与FEEL-IT有所不同(即YouTube和Facebook)。我们只考虑FEEL-IT中存在的情感子集。为了提供一个参考点,我们还展示了最常见类别(MFC)基线结果。结果显示,在FEEL-IT上的训练带来了稳定的性能,即使在不同情境的数据集上也是如此。
Training Dataset | Macro-F1 | Accuracy |
---|---|---|
MFC | 0.20 | 0.64 |
FEEL-IT | 0.57 | 0.73 |
from transformers import pipeline classifier = pipeline("text-classification",model='MilaNLProc/feel-it-italian-emotion',top_k=2) prediction = classifier("Oggi sono proprio contento!") print(prediction)
如果您在项目中使用此模型,请使用以下bibtex条目:
@inproceedings{bianchi2021feel, title = {{"FEEL-IT: Emotion and Sentiment Classification for the Italian Language"}}, author = "Bianchi, Federico and Nozza, Debora and Hovy, Dirk", booktitle = "Proceedings of the 11th Workshop on Computational Approaches to Subjectivity, Sentiment and Social Media Analysis", year = "2021", publisher = "Association for Computational Linguistics", }