数据集:

bgspaditya/maroon_sum_dataset

语言:

id

大小:

100M<n<1B

许可:

mit
英文

数据集名称 数据集卡片

数据集摘要

MaroonSum数据集是印度尼西亚摘要数据集(IDLiputan6、IndoSum、XLSum-Indo)的组合,经过预处理,删除了像"Liputan6 ...."、作者信息等无意义的词语,仅选择了文章和摘要特征

支持的任务和排行榜

[需要更多信息]

语言

[需要更多信息]

数据集结构

数据实例

[需要更多信息]

数据字段

[需要更多信息]

数据划分

[需要更多信息]

数据集创建

策展理由

[需要更多信息]

来源数据

初始数据收集和规范化

[需要更多信息]

谁是源语言的制作者?

[需要更多信息]

标注

标注过程

[需要更多信息]

标注者是谁?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据时的考虑事项

数据集的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

附加信息

数据集策展人

[需要更多信息]

许可信息

[需要更多信息]

引用信息

[需要更多信息]

贡献

[需要更多信息]