关于包含来自 WikiDoc 的病人信息的数据集,请参考 this dataset
该数据集包含了从 WikiDoc 提取的医疗问题-回答对, WikiDoc 是一个协作平台,医疗专业人士可以在该平台上分享和贡献最新的医疗知识。该平台有两个主要子站点,即"Living Textbook"(活字本)和"Patient Information"(病人信息)。"Living Textbook" 包含各种医学专业的章节,我们对其进行了爬取。然后我们使用 GPT-3.5-Turbo 将段落标题改写为问题,并将段落作为答案。
注意:该数据集仍在进行中。虽然从病人信息中提取的问答对似乎大部分是正确的,但在约30%的情况下,使用 GPT-3.5-Turbo 进行转换可能会产生不理想的结果。我们正在清理这个数据集。
待定