数据集:

eitb_parcc

任务:

翻译

语言:

es eu

计算机处理:

multilingual

大小:

100K<n<1M

语言创建人:

found

批注创建人:

found

源数据集:

original
英文

[数据集名称] 的数据集卡片

数据集摘要

EiTB-ParCC:可比新闻的平行语料库。这是由Vicomtech( https://www.vicomtech.org )提供的巴斯克-西班牙平行语料库,从巴斯克公共广播集团Euskal Irrati Telebista制作的可比新闻中提取而来。

支持的任务和排行榜

底层任务是机器翻译。

语言

[需要更多信息]

数据集结构

数据实例

[需要更多信息]

数据字段

[需要更多信息]

数据划分

[需要更多信息]

数据集创建

策划理由

[需要更多信息]

数据源

初始数据采集和规范化

[需要更多信息]

源语言制作者是谁?

[需要更多信息]

标注

注释过程

[需要更多信息]

标注者是谁?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据的注意事项

数据的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

其他信息

数据集策划者

[需要更多信息]

许可信息

[需要更多信息]

引用信息

@InProceedings{TIEDEMANN12.463,
  author = {J{\"o}rg Tiedemann},
  title = {Parallel Data, Tools and Interfaces in OPUS},
  booktitle = {Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12)},
  year = {2012},
  month = {may},
  date = {23-25},
  address = {Istanbul, Turkey},
  editor = {Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Mehmet Ugur Dogan and Bente Maegaard and Joseph Mariani and Jan Odijk and Stelios Piperidis},
  publisher = {European Language Resources Association (ELRA)},
  isbn = {978-2-9517408-7-7},
  language = {english}
 }

贡献

感谢 @patil-suraj 添加了这个数据集。