数据集:
tab_fact
任务:
文本分类子任务:
fact-checking语言:
en计算机处理:
monolingual大小:
100K<n<1M语言创建人:
crowdsourced批注创建人:
crowdsourced源数据集:
original预印本库:
arxiv:1909.02164许可:
cc-by-4.0验证文本假设是否基于给定证据为真,也被称为事实验证,它在自然语言理解和语义表示的研究中扮演着重要角色。然而,现有研究仅限于处理非结构化文本证据(例如,句子和段落、一组段落),而使用结构化证据(如表格、图表和数据库)进行验证仍未被探索。TABFACT是一个具有16,000个维基百科表格作为118,000个人工注释语句的证据的大规模数据集,用于带有半结构化证据的事实验证。这些语句被标记为ENTALLED或REFUTED。TABFACT具有挑战性,因为它既涉及软语言推理,又涉及硬符号推理。
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
初始数据收集和归一化[需要更多信息]
谁是源语言生产者?[需要更多信息]
[需要更多信息]
注释过程[需要更多信息]
谁是注释者?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
@inproceedings{2019TabFactA, title={TabFact : A Large-scale Dataset for Table-based Fact Verification}, author={Wenhu Chen, Hongmin Wang, Jianshu Chen, Yunkai Zhang, Hong Wang, Shiyang Li, Xiyou Zhou and William Yang Wang}, booktitle = {International Conference on Learning Representations (ICLR)}, address = {Addis Ababa, Ethiopia}, month = {April}, year = {2020} }
感谢 @patil-suraj 添加了这个数据集。