MEDIQA NLI 数据集卡片

自然语言推论(NLI)是一种确定给定假设是否可以从给定前提中推断出来的任务。也被称为文本蕴涵(RTE)，这个任务在研究者中享有一定的流行度。然而，几乎所有的数据集都集中在开放领域的数据上，如新闻文本、博客等。为了填补这一空白，创建了用于医学领域语言推断的MedNLI数据集。MedNLI是一个从MIMIC-III v1.4获取数据的衍生数据集。为了刺激该问题的研究，2019年在生物医学自然语言处理(BioNLP)研讨会上组织了一个关于医学推论和问题回答(MEDIQA)的共享任务。提供的数据集是MEDIQA共享任务中NLI挑战的405个前提-假设对的测试集。共享任务的参与者需要使用MedNLI数据开发他们的模型，并使用此数据集作为对每个参与者提交结果进行评分的未知数据集。

引用信息

@misc{https://doi.org/10.13026/gtv4-g455,
    title        = {MedNLI for Shared Task at ACL BioNLP 2019},
    author       = {Shivade,  Chaitanya},
    year         = 2019,
    publisher    = {physionet.org},
    doi          = {10.13026/GTV4-G455},
    url          = {https://physionet.org/content/mednli-bionlp19/}
}

作者:

bigbio

数据集大小:

30.73 KB