数据集:
qed_amara
任务:
翻译计算机处理:
multilingual大小:
100K<n<1M语言创建人:
found批注创建人:
found源数据集:
original许可:
license:unknown要加载一个不在配置文件中的语言对,你只需要指定语言代码作为pairs。您可以在Dataset Description的主页部分中找到有效的语言对: http://opus.nlpl.eu/QED.php 例如
dataset = load_dataset("qed_amara", lang1="cs", lang2="nb")
[需要更多信息]
数据集中的语言有:
这里有一些问题和事实的示例:
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
初始数据收集和规范化[需要更多信息]
谁是源语言的产生者?[需要更多信息]
[需要更多信息]
注释流程[需要更多信息]
谁是标注者?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
感谢 @abhishekkrthakur 添加了这个数据集。