数据集:
GEM/ART
语言:
en计算机处理:
unknown语言创建人:
unknown批注创建人:
automatically-created源数据集:
original其他:
reasoning许可:
apache-2.0您可以在 GEM Website 找到主数据卡片。
推理是推断出最合理解释的过程。例如,如果珍妮回到家发现房子一团糟,而且她记得她出门时留了个窗户开着,她可以假设是有小偷闯入她的房子并造成了这一混乱局面,因为这是最合理的解释。这个数据加载器专注于NLG的因果推理:在自然语言中解释给定的观察。
您可以通过以下方式加载数据集:
import datasets data = datasets.load_dataset('GEM/ART')
数据加载器可以在 here 找到。
网址 论文 作者Chandra Bhagavatula (AI2), Ronan Le Bras (AI2), Chaitanya Malaviya (AI2), Keisuke Sakaguchi (AI2), Ari Holtzman (AI2, UW), Hannah Rashkin (AI2, UW), Doug Downey (AI2), Wen-tau Yih (AI2), Yejin Choi (AI2, UW)
@inproceedings{ Bhagavatula2020Abductive, title={Abductive Commonsense Reasoning}, author={Chandra Bhagavatula and Ronan Le Bras and Chaitanya Malaviya and Keisuke Sakaguchi and Ari Holtzman and Hannah Rashkin and Doug Downey and Wen-tau Yih and Yejin Choi}, booktitle={International Conference on Learning Representations}, year={2020}, url={https://openreview.net/forum?id=Byg1v1HKDB} }联系人姓名
Chandra Bhagavatulla
联系人邮箱chandrab@allenai.org
有排行榜吗?否
否
支持的语言英文
使用语言源头Crowdworkers 在美国、加拿大、英国和澳大利亚的亚马逊 Mechanical Turk 平台上。
许可证apache-2.0: Apache 许可证2.0
预期的使用目的研究基于语言的诱因推理的可行性。训练和评估模型,以生成一个合理的假设来解释给定的两个观察。
主要任务推理
工业
策展组织Allen AI 研究所
数据集创建者Chandra Bhagavatula (AI2), Ronan Le Bras (AI2), Chaitanya Malaviya (AI2), Keisuke Sakaguchi (AI2), Ari Holtzman (AI2, UW), Hannah Rashkin (AI2, UW), Doug Downey (AI2), Wen-tau Yih (AI2), Yejin Choi (AI2, UW)
资金支持Allen AI 研究所
谁将数据集添加到 GEM?Chandra Bhagavatula (AI2), Ronan LeBras (AI2), Aman Madaan (CMU), Nico Daheim (RWTH Aachen University)
解释是由Crowdworkers使用数据集的创建者设计的自定义模板进行创作。
示例实例{ 'gem_id': 'GEM-ART-validation-0', 'observation_1': 'Stephen was at a party.', 'observation_2': 'He checked it but it was completely broken.', 'label': 'Stephen knocked over a vase while drunk.' }数据拆分
推理是人类的重要能力,而ART是第一个用于研究基于语言的诱因推理的数据集。
类似的数据集否
该数据集衡量的能力模型能否对给定的一对观察进行诱因推理。
否
是否有额外的划分?否
模型能否对给定的一对观察进行诱因推理。
指标BLEU,BERT-Score,ROUGE
是否有先前的结果?否
否
众包
众包地点亚马逊 Mechanical Turk
语言生产者语言生产者为美国、加拿大、英国和澳大利亚的英语使用者。
涵盖的主题否
数据验证由众包工作者进行验证
是否对数据进行了过滤?算法过滤
过滤条件在 paper 中描述的对抗性过滤算法
自动创建的
注释服务?否
注释值每个观察与一系列 COMET ( https://arxiv.org/abs/1906.05317 ) 推理相关联
是否有质量控制?无
否
没有PII
不包含PII的理由数据集包含日常事件,不包含姓名、电子邮件、地址等信息。
否
否
否
否
无
公有领域
语言数据的版权限制公有领域