数据集:
billsum
许可:
预印本库:
arxiv:1910.00523源数据集:
original批注创建人:
found语言创建人:
found大小:
10K<n<100K计算机处理:
monolingual语言:
任务:
BillSum是对美国国会和加利福尼亚州议案进行摘要。
有几个特征:
'train'的示例如下所示。
{
"summary": "some summary",
"text": "some text.",
"title": "An act to amend Section xxx."
}
所有拆分的数据字段都是相同的。
默认name | train | ca_test | test |
---|---|---|---|
default | 18949 | 1237 | 3269 |
数据包括三个部分:美国训练议案、美国测试议案和加利福尼亚测试议案。美国议案是根据美国政府出版局(GPO)提供的服务收集的,根据CC0-1.0许可证使用。2015-2016届的加利福尼亚州议案可以从立法机构的 website 获取。
谁是源语言的制作人?@misc{kornilova2019billsum,
title={BillSum: A Corpus for Automatic Summarization of US Legislation},
author={Anastassia Kornilova and Vlad Eidelman},
year={2019},
eprint={1910.00523},
archivePrefix={arXiv},
primaryClass={cs.CL}
}