数据集:
scan
任务:
文生文语言:
en计算机处理:
monolingual大小:
10K<n<100K语言创建人:
expert-generated批注创建人:
no-annotation源数据集:
original预印本库:
arxiv:1711.00350其他:
multi-turn许可:
bsd使用不同的划分方式的SCAN任务。
SCAN是一组用于研究组合学习和零样本泛化的简单语言驱动导航任务。
详见 https://github.com/brendenlake/SCAN 以获取划分的描述。
示例用法: data = datasets.load_dataset('scan/length')
'train'的一个示例如下所示。
addprim_turn_left'train'的一个示例如下所示。
filler_num0'train'的一个示例如下所示。
filler_num1'train'的一个示例如下所示。
filler_num2'train'的一个示例如下所示。
所有划分中的数据字段是相同的。
addprim_jumpname | train | test |
---|---|---|
addprim_jump | 14670 | 7706 |
addprim_turn_left | 21890 | 1208 |
filler_num0 | 15225 | 1173 |
filler_num1 | 16290 | 1173 |
filler_num2 | 17391 | 1173 |
@inproceedings{Lake2018GeneralizationWS, title={Generalization without Systematicity: On the Compositional Skills of Sequence-to-Sequence Recurrent Networks}, author={Brenden M. Lake and Marco Baroni}, booktitle={ICML}, year={2018}, url={https://arxiv.org/pdf/1711.00350.pdf}, }
感谢 @lewtun 、 @patrickvonplaten 、 @mariamabarham 、 @thomwolf 添加此数据集。