数据集:

ml6team/xsum_nl

语言:

nl

计算机处理:

monolingual

语言创建人:

machine-generated

批注创建人:

machine-generated

源数据集:

extended|xsum
英文

XSum NL 数据集卡片

数据集概要

该数据集是一个机器翻译数据集。其中的 XSum dataset 条数据是通过 this model 从英语翻译成荷兰语的。

更多关于该数据集格式的信息,请参见 Hugginface page of the original dataset

使用方式:

from datasets import load_dataset
load_dataset("csv", "ml6team/xsum_nl")

语言

荷兰语

数据集结构

数据实例

[需要更多信息]

数据字段

  • id: 文章的BBC ID。
  • document: 包含新闻文章正文的字符串。
  • summary: 包含文章一句话摘要的字符串。

数据拆分

  • 训练集
  • 测试集
  • 验证集

数据集创建

策划理由

[需要更多信息]

源数据

数据采集和标准化

[需要更多信息]

源语言的生产者是谁?

[需要更多信息]

注释

注释过程

[需要更多信息]

注释者是谁?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据的注意事项

数据集的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

其他信息

数据集策划者

[需要更多信息]

许可信息

[需要更多信息]

引用信息

[需要更多信息]

贡献

感谢 @github-username 添加了该数据集。