Swedish CNN/DailyMail 数据集只是经过机器翻译,以改进在瑞典摘要任务的微调。
在原始的英文版本中阅读完整详情: https://huggingface.co/datasets/cnn_dailymail
瑞典 CNN/DailyMail 数据集遵循与原始英文版本相同的拆分,并且有三个拆分:训练集、验证集和测试集。
Dataset Split | Number of Instances in Split |
---|---|
Train | 287,113 |
Validation | 13,368 |
Test | 11,490 |