数据集:
bigbio/mediqa_nli
自然语言推论(NLI)是一种确定给定假设是否可以从给定前提中推断出来的任务。也被称为文本蕴涵(RTE),这个任务在研究者中享有一定的流行度。然而,几乎所有的数据集都集中在开放领域的数据上,如新闻文本、博客等。为了填补这一空白,创建了用于医学领域语言推断的MedNLI数据集。MedNLI是一个从MIMIC-III v1.4获取数据的衍生数据集。为了刺激该问题的研究,2019年在生物医学自然语言处理(BioNLP)研讨会上组织了一个关于医学推论和问题回答(MEDIQA)的共享任务。提供的数据集是MEDIQA共享任务中NLI挑战的405个前提-假设对的测试集。共享任务的参与者需要使用MedNLI数据开发他们的模型,并使用此数据集作为对每个参与者提交结果进行评分的未知数据集。
@misc{https://doi.org/10.13026/gtv4-g455, title = {MedNLI for Shared Task at ACL BioNLP 2019}, author = {Shivade, Chaitanya}, year = 2019, publisher = {physionet.org}, doi = {10.13026/GTV4-G455}, url = {https://physionet.org/content/mednli-bionlp19/} }