数据集:
quora
任务:
文本分类语言:
en计算机处理:
monolingual大小:
100K<n<1M语言创建人:
found批注创建人:
expert-generated源数据集:
original许可:
license:unknownQuora 数据集由问题对组成,任务是确定这些问题是否是同义词(具有相同的意思)。
“train”的示例如下所示。
{ "is_duplicate": true, "questions": { "id": [1, 2], "text": ["Is this a sample question?", "Is this an example question?"] } }
数据字段在所有拆分中相同。
defaultname | train |
---|---|
default | 404290 |
未知许可证。
未知。
感谢 @thomwolf , @ghomasHudson , @lewtun 添加此数据集。