数据集:

autshumato

任务:

翻译

计算机处理:

multilingual

语言创建人:

expert-generated

批注创建人:

expert-generated

源数据集:

original

许可:

cc-by-2.5
英文

autshumato 数据集卡片

数据集摘要

南非宪法规定了多语言信息访问的实施。实际上,由于缺乏资源和能力来执行所需的大量翻译工作,这一目标受到了阻碍,以实现多语言信息访问。Autshumato 项目的目标之一是为三种南非语言对开发机器翻译系统。

支持的任务和排行榜

[需要更多信息]

语言

[需要更多信息]

数据集结构

数据实例

[需要更多信息]

数据字段

[需要更多信息]

数据划分

[需要更多信息]

数据集创建

策划理由

[需要更多信息]

源数据

[需要更多信息]

初始数据收集和标准化

[需要更多信息]

谁是源语言的生产者?

[需要更多信息]

注释

[需要更多信息]

注释过程

[需要更多信息]

谁是注释者?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据的注意事项

数据的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

其他信息

[需要更多信息]

数据集策划者

[需要更多信息]

许可信息

引用信息

@article{groenewald2010processing,
  title={Processing parallel text corpora for three South African language pairs in the Autshumato project},
  author={Groenewald, Hendrik J and du Plooy, Liza},
  journal={AfLaT 2010},
  pages={27},
  year={2010}
}

贡献

感谢 @Narsil 添加此数据集。