数据集:
spider
任务:
文生文语言:
en计算机处理:
monolingual大小:
1K<n<10K批注创建人:
expert-generated源数据集:
original其他:
text-to-sql许可:
cc-by-4.0Spider是一个由11位耶鲁大学学生注释的大规模复杂跨域语义解析和文本到SQL的数据集。Spider挑战的目标是开发自然语言接口以访问跨域数据库。
排行榜可在 https://yale-lily.github.io/spider 处查看。
数据集中的文本为英文。
数据集的实例是什么?
每个实例由自然语言问题和相应的SQL查询组成。
总共有多少实例?
每个实例包括哪些数据?
[需要更多信息]
训练集:7000个问题和SQL查询对,开发集:1034个问题和SQL查询对。
[需要更多信息]
[需要更多信息]
初始数据收集和规范化,语言制作者是谁?
[需要更多信息]
数据集由耶鲁大学的11名学生进行了注释。
注释过程,谁是标注者?
[需要更多信息]
[需要更多信息]
在主页上列出的作者正在维护或支持这个数据集。
[需要更多信息]
Spider数据集的许可证为 CC BY-SA 4.0 。
[需要更多信息]
@article{yu2018spider, title={Spider: A large-scale human-labeled dataset for complex and cross-domain semantic parsing and text-to-sql task}, author={Yu, Tao and Zhang, Rui and Yang, Kai and Yasunaga, Michihiro and Wang, Dongxu and Li, Zifan and Ma, James and Li, Irene and Yao, Qingning and Roman, Shanelle and others}, journal={arXiv preprint arXiv:1809.08887}, year={2018} }
感谢 @olinguyen 添加此数据集。