数据集:

tab_fact

子任务:

fact-checking

语言:

en

计算机处理:

monolingual

大小:

100K<n<1M

语言创建人:

crowdsourced

批注创建人:

crowdsourced

源数据集:

original

预印本库:

arxiv:1909.02164

许可:

cc-by-4.0
英文

TabFact数据集的数据卡片

数据集概述

验证文本假设是否基于给定证据为真,也被称为事实验证,它在自然语言理解和语义表示的研究中扮演着重要角色。然而,现有研究仅限于处理非结构化文本证据(例如,句子和段落、一组段落),而使用结构化证据(如表格、图表和数据库)进行验证仍未被探索。TABFACT是一个具有16,000个维基百科表格作为118,000个人工注释语句的证据的大规模数据集,用于带有半结构化证据的事实验证。这些语句被标记为ENTALLED或REFUTED。TABFACT具有挑战性,因为它既涉及软语言推理,又涉及硬符号推理。

支持的任务和排行榜

[需要更多信息]

语言

[需要更多信息]

数据集结构

数据实例

[需要更多信息]

数据字段

[需要更多信息]

数据拆分

[需要更多信息]

数据集创建

策划理由

[需要更多信息]

源数据

[需要更多信息]

初始数据收集和归一化

[需要更多信息]

谁是源语言生产者?

[需要更多信息]

注释

[需要更多信息]

注释过程

[需要更多信息]

谁是注释者?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据的注意事项

数据的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

其他信息

数据集策划者

[需要更多信息]

许可信息

[需要更多信息]

引用信息

@inproceedings{2019TabFactA,
  title={TabFact : A Large-scale Dataset for Table-based Fact Verification},
  author={Wenhu Chen, Hongmin Wang, Jianshu Chen, Yunkai Zhang, Hong Wang, Shiyang Li, Xiyou Zhou and William Yang Wang},
  booktitle = {International Conference on Learning Representations (ICLR)},
  address = {Addis Ababa, Ethiopia},
  month = {April},
  year = {2020}
}

贡献者

感谢 @patil-suraj 添加了这个数据集。