数据集:

NbAiLab/norwegian_parliament

语言:

no

计算机处理:

monolingual

大小:

1K<n<10K

语言创建人:

found

批注创建人:

expert-generated

源数据集:

original

许可:

cc-by-4.0
英文

数据集卡片创建指南

数据集概述

《挪威议会演讲》是一份由1998年至2016年在挪威议会(Storting)中发表的文本段落集合,由挪威两大主要政党Fremskrittspartiet和Sosialistisk Venstreparti的成员发表。该数据集中的文本附带了演讲时发言人所属的政党标签(也包括演讲日期)。

支持的任务和排行榜

[需要更多信息]

语言

数据集中的文本为挪威语。

数据集结构

数据实例

数据集中的一个示例实例。

{'label': 0, 'text': 'Verre er det med slagsmålene .'}

数据字段

  • id: 示例的索引
  • text: 演讲的文本
  • date: 演讲产生的日期 (YYYY-MM-DD)
  • label: 演讲人在那个时候所属的政党
    • 0 = Fremskrittspartiet
    • 1 = Sosialistisk Venstreparti

数据划分

数据集被划分为训练集、验证集和测试集,具体划分比例如下:

Tain Valid Test
Number of examples 3600 1200 1200

数据集在政党上保持平衡。

数据集创建

该数据集基于挪威议会(Storting)的公开信息创建,由挪威国家图书馆AI-Lab创建,用于评估其语言模型的性能。

额外信息

许可信息

本作品采用知识共享署名4.0国际许可协议。

引用信息

@misc{--,
      title={--},
      author={--},
      year={2021},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}