metaeval/equate | ATYUN.COM 官网-人工智能教程资讯全方位服务平台

数据集:

metaeval/equate

许可:

apache-2.0

数据集介绍文件清单

英文

EQUATEEQUATE（即文本蕴涵中评估数量理解能力）是一种用于评估文本蕴涵中的数量推理能力的新框架。EQUATE包括五个包含数量的NLI测试集。您可以在此处下载EQUATE。其中有三个测试用于量化推理，其语言取自真实世界的来源，例如新闻文章和社交媒体（RTE、NewsNLI Reddit），而另外两个则是受控合成测试，评估模型对量化器的推理能力和执行简单算术的能力（AWP、压力测试）。

@article{ravichander2019equate,
  title={EQUATE: A Benchmark Evaluation Framework for Quantitative Reasoning in Natural Language Inference},
  author={Ravichander, Abhilasha and Naik, Aakanksha and Rose, Carolyn and Hovy, Eduard},
  journal={arXiv preprint arXiv:1901.03735},
  year={2019}
}

作者:

metaeval

数据集大小:

406.4 KB