数据集:

tep_en_fa_para

任务:

翻译

语言:

en fa

计算机处理:

translation

大小:

100K<n<1M

语言创建人:

found

批注创建人:

found

源数据集:

original
英文

[tep_en_fa_para] 数据集卡

数据集摘要

TEP: 德黑兰英-波斯平行语料库。第一个由德黑兰大学自然语言和文本处理实验室提供的免费英-波斯语料库。

支持的任务和排行榜

底层任务是英-波斯语言对的机器翻译

语言

英语,波斯语

数据集结构

数据实例

[需要更多信息]

数据字段

[需要更多信息]

数据拆分

[需要更多信息]

数据集创建

策划理由

[需要更多信息]

源数据

初始数据收集和规范化

[需要更多信息]

源语言制作者是谁?

[需要更多信息]

注释

注释过程

[需要更多信息]

注释者是谁?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据的注意事项

数据的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

附加信息

数据集策划者

[需要更多信息]

授权信息

[需要更多信息]

引用信息

M. T. Pilevar, H. Faili, and A. H. Pilevar, “TEP: Tehran English-Persian Parallel Corpus”, in proceedings of 12th International Conference on Intelligent Text Processing and Computational Linguistics (CICLing-2011).

贡献

感谢 @spatil6 添加此数据集。