数据集:
xsum
任务:
摘要生成语言:
en计算机处理:
monolingual大小:
100K<n<1M语言创建人:
found批注创建人:
found源数据集:
original预印本库:
arxiv:1808.08745许可:
license:unknown极限摘要(XSum)数据集。
有三个特征:
'验证'的一个示例如下。
{ "document": "some-body", "id": "29750031", "summary": "some-sentence" }
所有拆分之间的数据字段是相同的。
defaultname | train | validation | test |
---|---|---|---|
default | 204045 | 11332 | 11334 |
@article{Narayan2018DontGM, title={Don't Give Me the Details, Just the Summary! Topic-Aware Convolutional Neural Networks for Extreme Summarization}, author={Shashi Narayan and Shay B. Cohen and Mirella Lapata}, journal={ArXiv}, year={2018}, volume={abs/1808.08745} }
感谢 @thomwolf , @lewtun , @mariamabarham , @jbragg , @lhoestq , @patrickvonplaten 添加了这个数据集。