数据集:

tanzil

任务:

翻译

计算机处理:

multilingual

大小:

100K<n<1M

语言创建人:

found

批注创建人:

found

源数据集:

original
英文

tanzil 数据集卡片

数据集简介

要加载配置中不存在的语言对,你只需要指定语言代码为pairs。你可以在数据集描述的主页部分找到有效的语言对: http://opus.nlpl.eu/Tanzil.php 例如

dataset = load_dataset("tanzil", lang1="en", lang2="ru")

支持的任务和排行榜

[需要更多信息]

语言

[需要更多信息]

数据集结构

数据实例

这里是一些问题和事实的示例:

数据字段

[需要更多信息]

数据分割

[需要更多信息]

数据集创建

策划理由

[需要更多信息]

来源数据

[需要更多信息]

初始数据收集和标准化

[需要更多信息]

谁是源语言的生产者?

[需要更多信息]

注释

[需要更多信息]

注释过程

[需要更多信息]

谁是注释者?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据的注意事项

数据的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

其他信息

数据集策划者

[需要更多信息]

许可信息

[需要更多信息]

引用信息

[需要更多信息]

贡献

感谢 @abhishekkrthakur 添加此数据集。