模型:

HooshvareLab/bert-fa-base-uncased-sentiment-deepsentipers-multi

英文

ParsBERT (v2.0)

一个基于Transformer的波斯语语言理解模型

我们重新构建了词汇表,并在新的波斯语语料库上对ParsBERT v1.1进行了微调,以便为在其他领域使用ParsBERT提供一些功能!有关先前和当前模型的最新信息,请关注 ParsBERT 仓库。

波斯情感 [Digikala, SnappFood, DeepSentiPers]

它旨在根据他们的情绪倾向对文本进行分类,如评论。我们对这个任务进行了三个知名数据集的测试:Digikala用户评论,SnappFood用户评论和DeepSentiPers以两种二元形式和多形式存在的数据集。

DeepSentiPers

它是SentiPers的一个平衡增强版本,包含12,138个关于数字产品的用户意见,标有五个不同的类别:两个正面类别(即开心和高兴),两个负面类别(即愤怒和生气)和一个中性类别。因此,该数据集可用于多类别和二元分类。在二元分类的情况下,从数据集中移除了中性类别及其对应的句子。

二元:

  • 负面(愤怒+生气)
  • 正面(开心+高兴)
  • 多类别

  • 愤怒
  • 生气
  • 中性
  • 开心
  • 高兴
  • Label #
    Furious 236
    Angry 1357
    Neutral 2874
    Happy 2848
    Delighted 2516

    下载 你可以从以下链接下载数据集:

    结果

    以下表格总结了ParsBERT与其他模型和架构相比获得的F1分数。

    Dataset ParsBERT v2 ParsBERT v1 mBERT DeepSentiPers
    SentiPers (Multi Class) 71.31* 71.11 - 69.33
    SentiPers (Binary Class) 92.42* 92.13 - 91.98

    如何使用:hugs:

    1234321
    Task Notebook
    Sentiment Analysis

    BibTeX条目和引用信息

    请在文献中引用如下:

    @article{ParsBERT,
        title={ParsBERT: Transformer-based Model for Persian Language Understanding},
        author={Mehrdad Farahani, Mohammad Gharachorloo, Marzieh Farahani, Mohammad Manthouri},
        journal={ArXiv},
        year={2020},
        volume={abs/2005.12515}
    }
    

    有问题吗?

    ParsBERT Issues 仓库上发布一个Github问题。