英文

"kor_nli"的数据集卡片

数据集简介

韩文自然语言推理数据集。

支持的任务和排行榜

More Information Needed

语言

More Information Needed

数据集结构

数据实例

multi_nli
  • 下载的数据集文件大小: 42.11 MB
  • 生成的数据集大小: 84.72 MB
  • 使用的总磁盘量: 126.85 MB

'train'的示例如下所示。

snli
  • 下载的数据集文件大小: 42.11 MB
  • 生成的数据集大小: 80.13 MB
  • 使用的总磁盘量: 122.25 MB

'train'的示例如下所示。

xnli
  • 下载的数据集文件大小: 42.11 MB
  • 生成的数据集大小: 1.56 MB
  • 使用的总磁盘量: 43.68 MB

'validation'的示例如下所示。

数据字段

所有拆分的数据字段是相同的。

multi_nli
  • premise :字符串型特征。
  • hypothesis :字符串型特征。
  • label :分类标签,可能的值包括 entailment (0), neutral (1), contradiction (2)。
snli
  • premise :字符串型特征。
  • hypothesis :字符串型特征。
  • label :分类标签,可能的值包括 entailment (0), neutral (1), contradiction (2)。
xnli
  • premise :字符串型特征。
  • hypothesis :字符串型特征。
  • label :分类标签,可能的值包括 entailment (0), neutral (1), contradiction (2)。

数据拆分

multi_nli
train
multi_nli 392702
snli
train
snli 550152
xnli
validation test
xnli 2490 5010

数据集创建

策划理由

More Information Needed

源数据

初始数据收集与规范化

More Information Needed

资源语言的生产者是谁?

More Information Needed

注释

注释过程

More Information Needed

注释者是谁?

More Information Needed

个人隐私信息

More Information Needed

使用数据的注意事项

数据的社会影响

More Information Needed

偏见讨论

More Information Needed

其他已知限制

More Information Needed

其他信息

数据集策划者

More Information Needed

许可信息

该数据集在 Creative Commons Attribution-ShareAlike license (CC BY-SA 4.0) 下获得许可。

引用信息

@article{ham2020kornli,
  title={KorNLI and KorSTS: New Benchmark Datasets for Korean Natural Language Understanding},
  author={Ham, Jiyeon and Choe, Yo Joong and Park, Kyubyong and Choi, Ilji and Soh, Hyungjoon},
  journal={arXiv preprint arXiv:2004.03289},
  year={2020}
}

贡献

感谢 @thomwolf @lhoestq @lewtun @patrickvonplaten 添加了该数据集。