数据集:
drop
许可:
cc-by-sa-4.0批注创建人:
crowdsourced源数据集:
original语言创建人:
crowdsourced大小:
10K<n<100K计算机处理:
monolingual语言:
enDROP:一个需要对段落进行离散推理的阅读理解基准。 DROP是一个众包、对抗性创建的、96k个问题的基准,在这个基准中,一个系统必须解决问题中的引用,可能是对多个输入位置的引用,并对它们执行离散操作(比如加法、计数或排序)。这些操作需要比之前的数据集更全面地理解段落的内容。
'验证集'的一个示例如下所示。
This example was too long and was cropped: { "answers_spans": { "spans": ["Chaz Schilens"] }, "passage": "\" Hoping to rebound from their loss to the Patriots, the Raiders stayed at home for a Week 16 duel with the Houston Texans. Oak...", "question": "Who scored the first touchdown of the game?" }
所有拆分中的数据字段都是相同的。
默认name | train | validation |
---|---|---|
default | 77409 | 9536 |
@inproceedings{Dua2019DROP, author={Dheeru Dua and Yizhong Wang and Pradeep Dasigi and Gabriel Stanovsky and Sameer Singh and Matt Gardner}, title={ {DROP}: A Reading Comprehension Benchmark Requiring Discrete Reasoning Over Paragraphs}, booktitle={Proc. of NAACL}, year={2019} }
感谢 @patrickvonplaten , @thomwolf , @mariamabarham , @lewtun 添加了这个数据集。