数据集:
msr_zhen_translation_parity
Achieving Human Parity on Automatic Chinese to English News Translation
人类评估结果和翻译结果,用于翻译师人性数据发布,如 https://blogs.microsoft.com/ai/machine-translation-news-test-set-human-parity/ 所述
翻译师人性数据发布包含与我们的论文 "在自动中英新闻翻译上实现人类水平"(发布于2018年3月14日)相关的所有人类评估结果和翻译结果。我们释放了这些数据以便于
该数据集包括:
WMT17 中文-英语语言对的两个新参考,一个基于人类从头翻译(Reference-HT),另一个基于人类后期编辑(Reference-PE);
我们的研究系统 Combo-4、Combo-5 和 Combo-6 生成的人类水平翻译,以及2017年10月16日收集的在线机器翻译服务 Online-A-1710 的翻译输出;
本研究提供的数据包还包括(但未解析和提供为该数据集的可处理特征)在人类评估活动中收集的所有数据点。
[需要更多信息]
此数据集包含 WMT17 中文-英语语言对的6个额外英语翻译。
[需要更多信息]
如摘要中所述,此数据集提供了 WMT17 中文-英语语言对的6个额外英语翻译。
数据字段的命名与关联的论文完全相同,以便进行更容易的交叉引用。
同一条记录的所有数据字段都是相同中文源句的翻译。
[需要更多信息]
[需要更多信息]
[需要更多信息]
谁是源语言的生产者?[需要更多信息]
[需要更多信息]
注释者是谁?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
引用信息可在此链接 Achieving Human Parity on Automatic Chinese to English News Translation 中找到
感谢 @leoxzhao 添加此数据集。