数据集:
persiannlp/parsinlu_query_paraphrasing
语言:
fa计算机处理:
monolingual大小:
1K<n<10K语言创建人:
expert-generated批注创建人:
expert-generated源数据集:
extended|quora|google预印本库:
arxiv:2012.06154许可:
cc-by-nc-sa-4.0这是一个波斯语查询重述任务(判断两个问题是否为重述)。这些问题部分来自Google自动补全,部分来自Quora重述数据集的翻译。
[需要更多信息]
该文本数据集为波斯语(fa)。
这是数据集中的一个示例:
{ "q1": "اعمال حج تمتع از چه روزی شروع میشود؟", "q2": "ویار از چه روزی شروع میشود؟", "label": "0", "category": "natural" }
训练集/开发集/测试集包含1830/898/1916个样本。
详情请查看 the corresponding draft 。
[需要更多信息]
源语言的生成者是谁?[需要更多信息]
[需要更多信息]
注释者是谁?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
CC BY-NC-SA 4.0许可
@article{huggingface:dataset, title = {ParsiNLU: A Suite of Language Understanding Challenges for Persian}, authors = {Khashabi, Daniel and Cohan, Arman and Shakeri, Siamak and Hosseini, Pedram and Pezeshkpour, Pouya and Alikhani, Malihe and Aminnaseri, Moin and Bitaab, Marzieh and Brahman, Faeze and Ghazarian, Sarik and others}, year={2020} journal = {arXiv e-prints}, eprint = {2012.06154}, }
感谢 @danyaljj 添加了这个数据集。