数据集:
bigbio/scitail
SciTail数据集是从多项选择科学考试和互联网句子中创建的蕴含关系数据集。每个问题和正确答案选择被转化为一个肯定性陈述,形成假设。我们使用信息检索从大型文本语料库中获取相关文本句子,并将这些句子作为前提P。我们通过众包的方式对这种前提-假设配对进行注释,标记为支持(蕴含)或不支持(中性),以创建SciTail数据集。该数据集包含27,026个示例,其中10,101个示例具有蕴含标签,16,925个示例具有中性标签。
@inproceedings{scitail, author = {Tushar Khot and Ashish Sabharwal and Peter Clark}, booktitle = {AAAI} title = {SciTail: A Textual Entailment Dataset from Science Question Answering}, year = {2018}