数据集:
zhengyun21/PMC-Patients
PMC-Patients 数据集是一种首创的数据集,由 PubMed Central (PMC) 中的病例报告中提取的16.7万个患者摘要、310万个患者与文章相关性注释和29.3万个患者与患者相似性注释组成。
这是纯粹的患者摘要数据集,具有关系注释。对于 ReCDS 基准,请参考 this dataset 。
基于 PMC-Patients,我们定义了两个任务来评估基于检索的临床决策支持系统(ReCDS):患者到文章的检索(PAR)和患者到患者的检索(PPR)。详细信息,请参考 our paper 和 leaderboard 。
英文(en)。
此文件包含了 PMC-Patients 中所有关于患者摘要的信息,格式为包含以下键的字典列表:
如果您有兴趣获取 PMC-Patients 的收集并重现我们的基准结果,请参考 this reporsitory 。
如果您在研究中发现 PMC-Patients 对您有帮助,请引用我们的作品:
@misc{zhao2023pmcpatients, title={PMC-Patients: A Large-scale Dataset of Patient Summaries and Relations for Benchmarking Retrieval-based Clinical Decision Support Systems}, author={Zhengyun Zhao and Qiao Jin and Fangyuan Chen and Tuorui Peng and Sheng Yu}, year={2023}, eprint={2202.13876}, archivePrefix={arXiv}, primaryClass={cs.CL} }