数据集:
tanzil
任务:
翻译计算机处理:
multilingual大小:
100K<n<1M语言创建人:
found批注创建人:
found源数据集:
original许可:
license:unknown要加载配置中不存在的语言对,你只需要指定语言代码为pairs。你可以在数据集描述的主页部分找到有效的语言对: http://opus.nlpl.eu/Tanzil.php 例如
dataset = load_dataset("tanzil", lang1="en", lang2="ru")
[需要更多信息]
[需要更多信息]
这里是一些问题和事实的示例:
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
初始数据收集和标准化[需要更多信息]
谁是源语言的生产者?[需要更多信息]
[需要更多信息]
注释过程[需要更多信息]
谁是注释者?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
感谢 @abhishekkrthakur 添加此数据集。