数据集:

medalpaca/medical_meadow_wikidoc

任务:

问答

语言:

en

许可:

cc
英文

WikiDoc 数据集卡片

关于包含来自 WikiDoc 的病人信息的数据集,请参考 this dataset

数据集概要

该数据集包含了从 WikiDoc 提取的医疗问题-回答对, WikiDoc 是一个协作平台,医疗专业人士可以在该平台上分享和贡献最新的医疗知识。该平台有两个主要子站点,即"Living Textbook"(活字本)和"Patient Information"(病人信息)。"Living Textbook" 包含各种医学专业的章节,我们对其进行了爬取。然后我们使用 GPT-3.5-Turbo 将段落标题改写为问题,并将段落作为答案。

注意:该数据集仍在进行中。虽然从病人信息中提取的问答对似乎大部分是正确的,但在约30%的情况下,使用 GPT-3.5-Turbo 进行转换可能会产生不理想的结果。我们正在清理这个数据集。

引用信息

待定