数据集:
bible_para
要加载不在配置中的语言对,你只需要将语言代码指定为lang1和lang2。你可以在数据集描述的主页部分找到有效的语言对: http://opus.nlpl.eu/bible-uedin.php 例如:
dataset = load_dataset("bible_para", lang1="fi", lang2="hi")
[需要更多信息]
[需要更多信息]
这里有一些问题和事实的示例:
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
初始数据收集和规范化[需要更多信息]
谁是源语言的生产者?[需要更多信息]
[需要更多信息]
注解过程[需要更多信息]
谁是标注者?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
感谢 @abhishekkrthakur 添加了这个数据集。