数据集:

chenghao/quora_questions

语言:

en

计算机处理:

monolingual

大小:

100K<n<1M

语言创建人:

found

批注创建人:

expert-generated

源数据集:

original

许可:

other
英文

"quora" 数据集卡片

数据集摘要

Quora数据集由问题对组成,任务是确定这些问题是否是重新表述的(具有相同的含义)。

支持的任务和排行榜

More Information Needed

语言

More Information Needed

数据集结构

数据实例

默认值
  • 下载的数据集文件大小:55.48 MB
  • 生成的数据集大小:55.46 MB
  • 总计使用的磁盘空间:110.94 MB

数据字段

所有分割的数据字段相同。

数据分割

name train
default 404290

数据集创建

策划理由

More Information Needed

源数据

初始数据收集和规范化

More Information Needed

谁是源语言生成者?

More Information Needed

注释

注释过程

More Information Needed

谁是注解者?

More Information Needed

个人和敏感信息

More Information Needed

使用数据的注意事项

数据的社会影响

More Information Needed

偏见讨论

More Information Needed

其他已知限制

More Information Needed

附加信息

数据集策划者

More Information Needed

许可信息

Quora Term of Service ,不得商用。

引用信息

未知。