英文

OverLim数据集概述

数据集简介

OverLim数据集包含了GLUE和SuperGLUE任务的一些自动翻译的瑞典语、丹麦语和挪威语(伯克梅尔语)版本,使用了OpusMT模型的MarianMT进行翻译。

未对翻译质量进行手动检查,因此可能存在错误。因此,对这些数据集的结果应该谨慎解释。

如果您想要一个简单的脚本来训练和评估您的模型,请看 here

支持的任务和排行榜

数据包含了以下GLUE和SuperGLUE任务:

  • GLUE
    • mnli
    • mrpc
    • qnli
    • qqp
    • rte
    • sst
    • stsb
    • wnli
  • SuperGLUE
    • boolq
    • cb
    • copa
    • rte

语言

  • 瑞典语
  • 丹麦语
  • 挪威语(伯克梅尔语)

数据集结构

数据实例

每个任务都有自己的一组特征,但它们都共享一个idx和label。

  • GLUE
    • mnli
      • premise , hypothesis
    • mrpc
      • text_a , text_b
    • qnli
      • premise , hypothesis
    • qqp
      • text_a , text_b
    • sst
      • text
    • stsb
      • text_a , text_b
    • wnli
      • premise , hypothesis
  • SuperGLUE
    • boolq
      • question , passage
    • cb
      • premise , hypothesis
    • copa
      • premise , choice1 , choice2 , question
    • rte
      • premise , hypothesis

数据集划分

为了获得测试集,我们重新确定了原始的验证集作为测试集,并将训练集划分为新的训练集和验证集,比例为80-20。

数据集创建

有关各个任务的更多信息,请参见( https://gluebenchmark.com )和( https://super.gluebenchmark.com )。

策划理由

训练非英语模型很容易,但缺乏评估数据集来比较其实际表现。

源数据

初始数据收集和归一化

[需要更多信息]

资源语言制作人是谁?

[需要更多信息]

注释

注释过程

[需要更多信息]

注释者是谁?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据的注意事项

数据的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

附加信息

数据集策划者

[需要更多信息]

许可信息

[需要更多信息]

引用信息

[需要更多信息]

贡献

感谢 @kb-labb 添加了这个数据集。