数据集:

bible_para

任务:

翻译

计算机处理:

multilingual

大小:

10K<n<100K

语言创建人:

found

批注创建人:

found

源数据集:

original

许可:

cc0-1.0
英文

BiblePara 数据集卡片

数据集摘要

要加载不在配置中的语言对,你只需要将语言代码指定为lang1和lang2。你可以在数据集描述的主页部分找到有效的语言对: http://opus.nlpl.eu/bible-uedin.php 例如:

dataset = load_dataset("bible_para", lang1="fi", lang2="hi")

支持的任务和排行榜

[需要更多信息]

语言

[需要更多信息]

数据集结构

数据实例

这里有一些问题和事实的示例:

数据字段

[需要更多信息]

数据划分

[需要更多信息]

数据集创建

策划理由

[需要更多信息]

来源数据

[需要更多信息]

初始数据收集和规范化

[需要更多信息]

谁是源语言的生产者?

[需要更多信息]

注解

[需要更多信息]

注解过程

[需要更多信息]

谁是标注者?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据的注意事项

数据的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

附加信息

数据集策划者

[需要更多信息]

许可信息

[需要更多信息]

引用信息

[需要更多信息]

贡献

感谢 @abhishekkrthakur 添加了这个数据集。