数据集:

ajders/machine_translated_cnn_dailymail_da_small

批注创建人:

machine-generated

许可:

apache-2.0

语言创建人:

machine-generated

大小:

1K<n<10K

计算机处理:

translation

语言:

da
英文

机器翻译CNN DailyMail小型数据集说明卡

数据集摘要

该数据集是CNN DailyMail数据集的机器翻译子集,翻译成丹麦语。数据集使用了 Helsinki-NLP/opus-mt-en-da 模型进行翻译。该数据集包含2872篇文章和摘要,用于丹麦文摘要生成任务。

数据集结构

机器翻译的文章(article)和相应的摘要(highlights)。

{
  'article': Value(dtype='string', id=None),
  'highlights': Value(dtype='string', id=None),
  'id': Value(dtype='string', id=None)
}

许可信息

该数据集发布遵循 Apache-2.0 License 许可协议。