数据集:
ro_sent
任务:
文本分类语言:
ro计算机处理:
monolingual大小:
10K<n<100K语言创建人:
found批注创建人:
found源数据集:
original预印本库:
arxiv:2009.08712许可:
license:unknown这个数据集是一个罗马尼亚情感分析数据集。它以作者在其示例中使用的处理形式存在,基于原始数据,原始数据包含罗马尼亚语的产品和电影评论。
[需要更多信息]
这个数据集是用罗马尼亚语编写的。
训练集中的一个实例:
{'id': '0', 'label': 1, 'original_id': '0', 'sentence': 'acest document mi-a deschis cu adevarat ochii la ceea ce oamenii din afara statelor unite s-au gandit la atacurile din 11 septembrie. acest film a fost construit in mod expert si prezinta acest dezastru ca fiind mai mult decat un atac asupra pamantului american. urmarile acestui dezastru sunt previzionate din multe tari si perspective diferite. cred ca acest film ar trebui sa fie mai bine distribuit pentru acest punct. de asemenea, el ajuta in procesul de vindecare sa vada in cele din urma altceva decat stirile despre atacurile teroriste. si unele dintre piese sunt de fapt amuzante, dar nu abuziv asa. acest film a fost extrem de recomandat pentru mine, si am trecut pe acelasi sentiment.'}
这个数据集有两个拆分:训练集包含17941个示例,测试集包含11005个示例。
[需要更多信息]
源数据集位于 this GitHub repository ,并基于产品和电影评论。原始来源未知。
源语言制作人是谁?[需要更多信息]
[需要更多信息]
注释者是谁?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
Stefan Daniel Dumitrescu,Andrei-Marious Avram,Sampo Pyysalo, @katakonst
[需要更多信息]
@article{dumitrescu2020birth, title={The birth of Romanian BERT}, author={Dumitrescu, Stefan Daniel and Avram, Andrei-Marius and Pyysalo, Sampo}, journal={arXiv preprint arXiv:2009.08712}, year={2020} }
感谢 @gchhablani 和 @iliemihai 添加了这个数据集。