数据集:
NbAiLab/norec_agg
任务:
文本分类语言:
en计算机处理:
monolingual大小:
1K<n<10K语言创建人:
found批注创建人:
expert-generated源数据集:
original预印本库:
arxiv:2011.02686许可:
cc-by-4.0Aggregated NoRec_fine:挪威细粒度情感数据集。该数据集由北欧语言处理实验室通过聚合NoReC_fine中的细粒度注释并删除具有冲突或无情感的句子创建。
[需要更多信息]
数据集中的文本为挪威语。
数据集中的一个实例示例。
{'label': 0, 'text': 'Verre er det med slagsmålene .'}
数据集分为训练集、验证集和测试集,大小如下:
Tain | Valid | Test | |
---|---|---|---|
Number of examples | 2675 | 516 | 417 |
此数据集主要基于L. Øvrelid、P. Mæhlum、J. Barnes和E. Velldal在LREC 2020上接受的论文"A Fine-Grained Sentiment Dataset for Norwegian"中描述的原始数据,但我们已经对另外3476个句子进行了注释,增加了数据集的总体大小和范围。
本作品采用知识共享署名4.0国际许可协议
@misc{sheng2020investigating, title={Investigating Societal Biases in a Poetry Composition System}, author={Emily Sheng and David Uthus}, year={2020}, eprint={2011.02686}, archivePrefix={arXiv}, primaryClass={cs.CL} }