数据集:

PNLPhub/FarsTail

许可:

apache-2.0

预印本库:

arxiv:2009.08820

大小:

1K<n<10K

语言:

fa
英文

数据集概述

波斯语(Farsi)是一种多中心语言,由约1.1亿人在伊朗、阿富汗和塔吉克斯坦等国家使用。在这里,我们呈现了第一个比较大规模的用于自然语言推理任务的波斯语数据集,名为FarsTail。该数据集包含有来自3,539个多项选择问题的共10,367个样本。训练集、验证集和测试集分别包含7,266个、1,537个和1,564个样本。

许可信息

[需要更多信息]

引用信息

@article{amirkhani2020farstail,
  title={FarsTail: A Persian Natural Language Inference Dataset},
  author={Hossein Amirkhani, Mohammad Azari Jafari, Azadeh Amirak, Zohreh Pourjafari, Soroush Faridan Jahromi, and Zeinab Kouhkan},
  journal={arXiv preprint arXiv:2009.08820},
  year={2020}
}