数据集:

PORTULAN/glue-ptpt

语言:

pt

大小:

10K<n<100K

语言创建人:

machine-generated

源数据集:

glue

预印本库:

arxiv:2305.06721
英文

GLUE-PTPT -- 通用语言理解评估基准(European Portuguese版)

此数据集是为了评估 Albertina PT-* models 而创建的。

如果您使用此数据集,请引用:

@misc{rodrigues2023advancing,
  title={Advancing Neural Encoding of Portuguese with Transformer Albertina PT-*}, 
  author={João Rodrigues and Luís Gomes and João Silva and António Branco and Rodrigo Santos and Henrique Lopes Cardoso and Tomás Osório},
  year={2023},
  eprint={2305.06721},
  archivePrefix={arXiv},
  primaryClass={cs.CL}
}

到目前为止,只有4个任务已经翻译成了欧洲葡萄牙语:

  • MRPC
  • RTE
  • STS-B
  • WNLI

其余的任务将在将来添加。

有关通用语言理解评估(GLUE)数据集的信息,请参见 gluebenchmark.com