数据集:

ghomasHudson/hotpotExtended

英文

HotpotQA-extended

HotpotQA数据集的扩展版本,包含完整的维基百科文章。

HotpotQA数据集由众包工作者提供的问题组成,这些问题需要从多个维基百科文章中获取信息才能回答,从而测试模型进行多次跳问题回答的能力。这些数据通常被呈现为包含相关信息的段落列表,以及通过添加“干扰段落”来完全测试模型理解哪些信息与所提问题相关的设置。

在这个数据集中,我们通过将每个段落与其完整的维基百科页面扩展,并添加来自相似主题的其他干扰文章,以满足此基准测试的最低10,000个标记长度要求。