数据集:

ahazeemi/opus-medical-en-de

大小:

100K<n<1M

语言:

de en

任务:

翻译

其他:

medical
英文

"opus-medical-en-de"数据集卡片

这是一个包含多个领域的德英平行数据集,于 Aharoni and Goldberg (2020) 引入。这是一个新的数据拆分,避免了训练集向开发/测试集的重复示例和信息泄露。原始的多领域数据最初出现在 Koehn and Knowles (2017) 中,并包含在 Opus website 中提供的五个数据集中。