模型:
HooshvareLab/bert-fa-base-uncased-sentiment-deepsentipers-multi
一个基于Transformer的波斯语语言理解模型
我们重新构建了词汇表,并在新的波斯语语料库上对ParsBERT v1.1进行了微调,以便为在其他领域使用ParsBERT提供一些功能!有关先前和当前模型的最新信息,请关注 ParsBERT 仓库。
它旨在根据他们的情绪倾向对文本进行分类,如评论。我们对这个任务进行了三个知名数据集的测试:Digikala用户评论,SnappFood用户评论和DeepSentiPers以两种二元形式和多形式存在的数据集。
它是SentiPers的一个平衡增强版本,包含12,138个关于数字产品的用户意见,标有五个不同的类别:两个正面类别(即开心和高兴),两个负面类别(即愤怒和生气)和一个中性类别。因此,该数据集可用于多类别和二元分类。在二元分类的情况下,从数据集中移除了中性类别及其对应的句子。
二元:
多类别
Label | # |
---|---|
Furious | 236 |
Angry | 1357 |
Neutral | 2874 |
Happy | 2848 |
Delighted | 2516 |
下载 你可以从以下链接下载数据集:
以下表格总结了ParsBERT与其他模型和架构相比获得的F1分数。
Dataset | ParsBERT v2 | ParsBERT v1 | mBERT | DeepSentiPers |
---|---|---|---|---|
SentiPers (Multi Class) | 71.31* | 71.11 | - | 69.33 |
SentiPers (Binary Class) | 92.42* | 92.13 | - | 91.98 |
Task | Notebook |
---|---|
Sentiment Analysis | 1234321
请在文献中引用如下:
@article{ParsBERT, title={ParsBERT: Transformer-based Model for Persian Language Understanding}, author={Mehrdad Farahani, Mohammad Gharachorloo, Marzieh Farahani, Mohammad Manthouri}, journal={ArXiv}, year={2020}, volume={abs/2005.12515} }
在 ParsBERT Issues 仓库上发布一个Github问题。