英文

QR-AN数据集:一个包含法国议会问题-回答的主题分类和生成数据集。

这是一个主题分类的数据集,由 https://www2.assemblee-nationale.fr/recherche/resultats_questions 个问题和回答组成。

它包含188个不平衡的类别,80k个问题和回答被分为3个部分:训练集(60k),验证集(10k)和测试集(10k)。

可以通过使用'qran_generation'对其进行生成。

该数据集与Transformers的 run_summarization.py 脚本兼容,如果将以下行添加到summarization_name_mapping变量中:

"ccdv/cass-summarization": ("question", "answer")

run_glue.py 脚本兼容。