数据集:
capes
任务:
翻译计算机处理:
multilingual大小:
1M<n<10M语言创建人:
found批注创建人:
found源数据集:
original许可:
license:unknown从巴西高等教育改善协调委员会(CAPES)网站收集了一份包含英语和葡萄牙语论文摘要的平行语料库。该语料库针对所有语言对进行了句子对齐。使用Hunalign算法对约240,000个文档进行了收集和对齐。
底层任务是机器翻译。
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
源语言制造者是谁?[需要更多信息]
[需要更多信息]
注释者是谁?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
@inproceedings{soares2018parallel, title={A Parallel Corpus of Theses and Dissertations Abstracts}, author={Soares, Felipe and Yamashita, Gabrielli Harumi and Anzanello, Michel Jose}, booktitle={International Conference on Computational Processing of the Portuguese Language}, pages={345--352}, year={2018}, organization={Springer} }
感谢 @patil-suraj 添加了该数据集。