数据集:
crows_pairs
任务:
文本分类子任务:
text-scoring语言:
en计算机处理:
monolingual大小:
1K<n<10K语言创建人:
crowdsourced批注创建人:
crowdsourced源数据集:
original其他:
bias-evaluation许可:
cc-by-sa-4.0[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
Initial Data Collection and Normalization[需要更多信息]
Who are the source language producers?[需要更多信息]
[需要更多信息]
Annotation process[需要更多信息]
Who are the annotators?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
CrowS-Pairs在 Creative Commons Attribution-ShareAlike 4.0 International License 下许可。
它使用了来自 ROCStories corpora 和 MNLI 的小说部分的提示。有关更多详细信息,请参阅它们的论文。
@inproceedings{nangia-etal-2020-crows, title = "{C}row{S}-Pairs: A Challenge Dataset for Measuring Social Biases in Masked Language Models", author = "Nangia, Nikita and Vania, Clara and Bhalerao, Rasika and Bowman, Samuel R.", booktitle = "Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP)", month = nov, year = "2020", address = "Online", publisher = "Association for Computational Linguistics", url = "https://aclanthology.org/2020.emnlp-main.154", doi = "10.18653/v1/2020.emnlp-main.154", pages = "1953--1967", }
感谢 @patil-suraj 添加了这个数据集。