数据集:

metaeval/equate

许可:

apache-2.0
英文

EQUATEEQUATE(即文本蕴涵中评估数量理解能力)是一种用于评估文本蕴涵中的数量推理能力的新框架。EQUATE包括五个包含数量的NLI测试集。您可以在此处下载EQUATE。其中有三个测试用于量化推理,其语言取自真实世界的来源,例如新闻文章和社交媒体(RTE、NewsNLI Reddit),而另外两个则是受控合成测试,评估模型对量化器的推理能力和执行简单算术的能力(AWP、压力测试)。

@article{ravichander2019equate,
  title={EQUATE: A Benchmark Evaluation Framework for Quantitative Reasoning in Natural Language Inference},
  author={Ravichander, Abhilasha and Naik, Aakanksha and Rose, Carolyn and Hovy, Eduard},
  journal={arXiv preprint arXiv:1901.03735},
  year={2019}
}