数据集:
debatelab/deepa2
这是一个不断增长的、精心策划的 deepa2 数据集收集,即包含对论证性文本进行全面逻辑分析的数据集。这个收集包含以下内容:
可以使用 deepa2 serve 工具将此收集中的数据渲染为文本到文本的示例。
对于为该数据集标注任务的每个任务,简要描述标签、指标和建议的模型(如果有的话,附带到其 HuggingFace 实现的链接)。对于未包括在结构化标签集中的任务,给出类似的描述(将 task-category-tag 替换为适当的 other:other-task-name)。
英语,将来将扩展到其他语言。
此收集包含以下 deepa2 数据集:
参见: https://github.com/debatelab/deepa2/tree/main/docs
参见: https://github.com/debatelab/deepa2/tree/main/docs
feature | esnli | enbank | aifdb | aaac | argq | argkp |
---|---|---|---|---|---|---|
source_text | x | x | x | x | x | x |
title | x | x | ||||
gist | x | x | x | x | ||
source_paraphrase | x | x | x | x | ||
context | x | x | x | |||
reasons | x | x | x | x | x | |
conjectures | x | x | x | x | x | |
argdown_reconstruction | x | x | x | x | ||
erroneous_argdown | x | x | ||||
premises | x | x | x | x | ||
intermediary_conclusion | x | |||||
conclusion | x | x | x | x | ||
premises_formalized | x | x | x | |||
intermediary_conclusion_formalized | x | |||||
conclusion_formalized | x | x | x | |||
predicate_placeholders | x | |||||
entity_placeholders | x | |||||
misc_placeholders | x | x | x | |||
plchd_substitutions | x | x | x |
每个子数据集包含三个划分:训练集、验证集和测试集。
许多 NLP 数据集专注于逻辑分析和论证重构相关的任务。此收集试图将这些资源统一在一个共同的框架中。
参见:子数据集
Gregor Betz, KIT; Kyle Richardson, Allen AI
我们根据其原始许可证重新分发导入的子数据集:
Sub-dataset | License |
---|---|
esnli | MIT |
aifdb | free for academic use ( 12311321 ) |
enbank | CC BY 4.0 |
aaac | CC BY 4.0 |
argq | CC BY SA 4.0 |
argkp | Apache |
@article{betz2021deepa2, title={DeepA2: A Modular Framework for Deep Argument Analysis with Pretrained Neural Text2Text Language Models}, author={Gregor Betz and Kyle Richardson}, year={2021}, eprint={2110.01509}, archivePrefix={arXiv}, primaryClass={cs.CL} }