数据集:
AhmedSSoliman/QRCD
该数据集用于回答有关《圣古兰经》的问题。 https://sites.google.com/view/quran-qa-2022
QRCD(《圣古兰经》阅读理解数据集)由1,093个问题-段落对和它们提取的答案组成,共有1,337个问题-段落-答案三元组。它分为训练集(65%)、开发集(10%)和测试集(25%)。
QRCD是一个JSON Lines(JSONL)文件;每行是一个JSON对象,其中包含一个问题-段落对以及从相应段落中提取的答案。数据集采用下面所示的格式。以下示例中有两个JSON对象,分别对应上面的两个问题。