数据集:

medalpaca/medical_meadow_wikidoc_patient_information

任务:

问答

语言:

en

许可:

cc
英文

WikiDoc 数据集卡片

有关包含生活教科书重述内容的数据集,请参阅 this dataset

数据集摘要

该数据集包含从 WikiDoc 中提取的医学问答对, WikiDoc 是医疗专业人员共享和贡献最新医学知识的协作平台。该平台有两个主要子站点,即"生活教科书"和"患者信息"。"生活教科书"包含各种医学专业的章节,我们进行了爬取。然后,我们使用GTP-3.5-Turbo将段落标题改写为问题,并将段落用作答案。患者信息以不同的结构化方式呈现,即每个部分的子标题已经是一个问题,因此无需改写它们。

注意:该数据集仍在进行中。虽然患者信息中的问答对似乎大多是正确的,但使用GPT-3.5-Turbo进行转换的结果在约30%的情况下令人不满意。我们正在清理这个数据集。

引用信息

TBA