数据集:
bigbio/n2c2_2018_track1
2018年全国NLP临床挑战共享任务的第一项任务旨在确定NLP系统能否被训练出来识别是否符合真实临床试验的一组选择标准的患者。所选标准包括测量检测(“任意HbA1c值介于6.5%和9.5%之间”),推理(“使用阿司匹林预防心肌梗死”),时间推理(“过去一年内诊断出酮症酸中毒”)和专家判断(“重要的糖尿病相关并发症”)。对于语料库,我们使用了来自2014年i2b2/UTHealth共享任务4的美国英语、纵向临床叙述的数据集。
最终选定的13个选择标准如下:
训练集包含202个患者记录,具有文档级别的注释,其中10个记录包含指示注释者证据的文本范围,而测试集包含86个记录。
注意:
@article{DBLP:journals/jamia/StubbsFSHU19, author = { Amber Stubbs and Michele Filannino and Ergin Soysal and Samuel Henry and Ozlem Uzuner }, title = {Cohort selection for clinical trials: n2c2 2018 shared task track 1}, journal = {J. Am. Medical Informatics Assoc.}, volume = {26}, number = {11}, pages = {1163--1171}, year = {2019}, url = {https://doi.org/10.1093/jamia/ocz163}, doi = {10.1093/jamia/ocz163}, timestamp = {Mon, 15 Jun 2020 16:56:11 +0200}, biburl = {https://dblp.org/rec/journals/jamia/StubbsFSHU19.bib}, bibsource = {dblp computer science bibliography, https://dblp.org} }