数据集:
kor_nli
韩文自然语言推理数据集。
'train'的示例如下所示。
snli'train'的示例如下所示。
xnli'validation'的示例如下所示。
所有拆分的数据字段是相同的。
multi_nlitrain | |
---|---|
multi_nli | 392702 |
train | |
---|---|
snli | 550152 |
validation | test | |
---|---|---|
xnli | 2490 | 5010 |
该数据集在 Creative Commons Attribution-ShareAlike license (CC BY-SA 4.0) 下获得许可。
@article{ham2020kornli, title={KorNLI and KorSTS: New Benchmark Datasets for Korean Natural Language Understanding}, author={Ham, Jiyeon and Choe, Yo Joong and Park, Kyubyong and Choi, Ilji and Soh, Hyungjoon}, journal={arXiv preprint arXiv:2004.03289}, year={2020} }
感谢 @thomwolf , @lhoestq , @lewtun , @patrickvonplaten 添加了该数据集。