ParsBERT（v2.0）

波斯语理解的基于Transformer的模型

我们在新的波斯语语料库上重新构建了词汇表，并对ParsBERT v1.1进行了微调，以便为在其他领域使用ParsBERT提供一些功能！有关先前和当前模型的最新信息，请关注 ParsBERT repo。

波斯情感 [Digikala、SnappFood、DeepSentiPers]

它旨在基于情感偏见对文本（例如评论）进行分类。我们对此任务进行了三个著名数据集的测试：Digikala用户评论、SnappFood用户评论以及DeepSentiPers的二进制形式和多形式类型。

Digikala

Digikala用户评论由 Open Data Mining Program (ODMP) 提供。该数据集包含62,321条用户评论，分为三类:

Label	#
no_idea	10394
not_recommended	15885
recommended	36042

下载您可以从 here 下载数据集

结果

下表总结了ParsBERT与其他模型和架构相比所获得的F1分数。

Dataset	ParsBERT v2	ParsBERT v1	mBERT	DeepSentiPers
Digikala User Comments	81.72	81.74*	80.74	-

如何使用 :hugs:

1234321

Task	Notebook
Sentiment Analysis

BibTeX条目和引用信息

请在出版物中引用如下：

@article{ParsBERT,
    title={ParsBERT: Transformer-based Model for Persian Language Understanding},
    author={Mehrdad Farahani, Mohammad Gharachorloo, Marzieh Farahani, Mohammad Manthouri},
    journal={ArXiv},
    year={2020},
    volume={abs/2005.12515}
}

有问题吗？

在 ParsBERT Issues repo上发布Github问题。

作者:

Hooshvare Research Lab

数据集大小:

1.82 GB