数据集:

multi_para_crawl

任务:

翻译

计算机处理:

multilingual

大小:

100K<n<1M

语言创建人:

found

批注创建人:

found

源数据集:

original

许可:

cc0-1.0
英文

MultiParaCrawl 数据集卡片

数据集概要

要加载一个不在配置中的语言对,您只需要按照下面的方式指定语言代码。您可以在数据集描述的主页部分找到有效的语言对: http://opus.nlpl.eu/MultiParaCrawl.php 例如

dataset = load_dataset("multi_para_crawl", lang1="en", lang2="nl")

Supported Tasks and Leaderboards

[More Information Needed]

语言

[More Information Needed]

数据集结构

数据实例

[More Information Needed]

数据字段

[More Information Needed]

数据拆分

[More Information Needed]

数据集创建

Curation Rationale

[More Information Needed]

源数据

[More Information Needed]

Initial Data Collection and Normalization

[More Information Needed]

Who are the source language producers?

[More Information Needed]

Annotations

[More Information Needed]

Annotation process

[More Information Needed]

Who are the annotators?

[More Information Needed]

Personal and Sensitive Information

[More Information Needed]

使用数据的注意事项

数据的社会影响

[More Information Needed]

偏见讨论

[More Information Needed]

其他已知限制

[More Information Needed]

其他信息

数据集策划者

[More Information Needed]

许可信息

[More Information Needed]

引用信息

[More Information Needed]

贡献

感谢 @abhishekkrthakur 添加此数据集。