数据集:
metaeval/equate
许可:
apache-2.0EQUATEEQUATE(即文本蕴涵中评估数量理解能力)是一种用于评估文本蕴涵中的数量推理能力的新框架。EQUATE包括五个包含数量的NLI测试集。您可以在此处下载EQUATE。其中有三个测试用于量化推理,其语言取自真实世界的来源,例如新闻文章和社交媒体(RTE、NewsNLI Reddit),而另外两个则是受控合成测试,评估模型对量化器的推理能力和执行简单算术的能力(AWP、压力测试)。
@article{ravichander2019equate, title={EQUATE: A Benchmark Evaluation Framework for Quantitative Reasoning in Natural Language Inference}, author={Ravichander, Abhilasha and Naik, Aakanksha and Rose, Carolyn and Hovy, Eduard}, journal={arXiv preprint arXiv:1901.03735}, year={2019} }