数据集:

FreedomIntelligence/huatuo26M-testdatasets

语言:

zh

大小:

1K<n<10K

预印本库:

arxiv:2305.01526

其他:

medical

许可:

apache-2.0
英文

huatuo26M-testdatasets数据集卡片

数据集概述

我们很高兴地宣布发布我们的评估数据集,它是Huatuo-26M的一个子集。该数据集包含了6,000个条目,我们在相关研究论文中用于自然语言生成(NLG)实验。

我们鼓励研究人员和开发者使用此评估数据集来评估他们自己模型的性能。这不仅是评估生成响应的准确性和相关性的机会,还是探究模型在理解和生成复杂医学语言方面的能力的机会。

注意:为了保护患者隐私,所有数据点都经过了匿名处理,且严格遵守数据保护和隐私法规。

引用

@misc{li2023huatuo26m,
      title={Huatuo-26M, a Large-scale Chinese Medical QA Dataset}, 
      author={Jianquan Li and Xidong Wang and Xiangbo Wu and Zhiyi Zhang and Xiaolong Xu and Jie Fu and Prayag Tiwari and Xiang Wan and Benyou Wang},
      year={2023},
      eprint={2305.01526},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}