数据集:
sberquad
任务:
问答子任务:
extractive-qa语言:
ru计算机处理:
monolingual大小:
10K<n<100K批注创建人:
crowdsourced源数据集:
original预印本库:
arxiv:1912.09723许可:
license:unknownSber 问答数据集(SberQuAD)是一个阅读理解数据集,由众包工作者在一组维基百科文章上提出问题,每个问题的答案是相应阅读段落中的一段文本或片段,或者问题可能无法回答。俄语原始模型在2017年的 Sberbank 数据科学之旅中呈现。
[需要更多信息]
俄语
{ "context": "Первые упоминания о строении человеческого тела встречаются в Древнем Египте...", "id": 14754, "qas": [ { "id": 60544, "question": "Где встречаются первые упоминания о строении человеческого тела?", "answers": [{"answer_start": 60, "text": "в Древнем Египте"}], } ] }
name | train | validation | test |
---|---|---|---|
plain_text | 45328 | 5036 | 23936 |
[需要更多信息]
[需要更多信息]
源语言生产者是谁?[需要更多信息]
[需要更多信息]
注释者是谁?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
@InProceedings{sberquad, doi = {10.1007/978-3-030-58219-7_1}, author = {Pavel Efimov and Andrey Chertok and Leonid Boytsov and Pavel Braslavski}, title = {SberQuAD -- Russian Reading Comprehension Dataset: Description and Analysis}, booktitle = {Experimental IR Meets Multilinguality, Multimodality, and Interaction}, year = {2020}, publisher = {Springer International Publishing}, pages = {3--15} }
感谢 @alenusch 添加此数据集。