数据集:
scielo
任务:
翻译计算机处理:
multilingual大小:
100K<n<1M语言创建人:
found批注创建人:
found源数据集:
original预印本库:
arxiv:1905.01852许可:
license:unknown这是一个从SciELO数据库收集的全文科学论文的平行语料库,包括以下语言:英语、葡萄牙语和西班牙语。该语料库对所有语言对进行了句子对齐,还对一小部分句子进行了三语对齐。句子对齐是使用Hunalign算法进行的。
底层任务是机器翻译。
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
谁是源语言的制作者?[需要更多信息]
[需要更多信息]
注释者是谁?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
@inproceedings{soares2018large, title={A Large Parallel Corpus of Full-Text Scientific Articles}, author={Soares, Felipe and Moreira, Viviane and Becker, Karin}, booktitle={Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC-2018)}, year={2018} }
感谢 @patil-suraj 添加了这个数据集。