数据集:
Gabriel/citesum_swe
瑞典Citesum数据集仅经过机器翻译,以改善在瑞典摘要任务上的下游微调。
具体详情请参阅原始英文版本: https://huggingface.co/datasets/citesum
https://arxiv.org/abs/2205.06207
Yuning Mao,Ming Zhong,Jiawei HanUniversity of Illinois Urbana-Champaign{yuningm2,mingz5,hanj}@illinois.edu
瑞典xsum数据集遵循与原始英文版本相同的拆分,并具有3个拆分:train,validation和test。
Dataset Split | Number of Instances in Split |
---|---|
Train | 83,304 |
Validation | 4,721 |
Test | 4,921 |