数据集:

rcds/swiss_ruling_summarization

预印本库:

arxiv:2306.09237

源数据集:

original

批注创建人:

machine-generated

语言创建人:

expert-generated

大小:

10K<n<100K

计算机处理:

multilingual
英文

领先决策摘要数据集卡片

数据集概要

该数据集包含瑞士领先决策的文本和摘要。

支持的任务和排行榜

语言

瑞士有四种官方语言,其中德语、法语和意大利语被用来表示。裁决书和书记员以案件语言书写决定。

Language Subset Number of Documents
German de 12K
French fr 5K
Italian it 835

数据集结构

  • decision_id: 决策的唯一标识符
  • header: 决策的简短标题
  • regeste: 领导决策的摘要
  • text: 领导决策的主要文本
  • law_area: 决策的法律领域
  • law_sub_area: 决策的法律子领域
  • language: 决策的语言
  • year: 决策的年份
  • court: 决策的法院
  • chamber: 决策的法庭
  • canton: 决策的州
  • region: 决策的地区

数据字段

[需要更多信息]

数据实例

[需要更多信息]

数据字段

[需要更多信息]

数据拆分

数据集创建

策划理由

来源数据

初始数据收集和标准化

原始数据以未经处理的HTML格式(HTML)从瑞士联邦最高法院( https://www.bger.ch )发布。决策文书从Entscheidsuche门户网站( https://entscheidsuche.ch )以HTML格式下载。

谁是源语言的生产者?

裁决书和书记员以案件语言书写决定。

注释

注释过程由谁进行?

个人和敏感信息

数据集包含来自瑞士联邦最高法院的公开可用的法院决定。根据以下指南,法院在出版之前对个人或敏感信息进行了匿名处理: https://www.bger.ch/home/juridiction/anonymisierungsregeln.html

使用数据的注意事项

数据的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

其他信息

数据集策划者

[需要更多信息]

许可信息

我们在CC-BY-4.0下发布数据,该许可证符合法院许可证( https://www.bger.ch/files/live/sites/bger/files/pdf/de/urteilsveroeffentlichung_d.pdf )©瑞士联邦最高法院,2002-2022

本网站的编辑内容和整理的文本版权归瑞士联邦最高法院所有,采用知识共享署名4.0国际许可协议进行许可。这意味着您可以重新使用内容,但您必须提及来源并指出您所做的任何更改。来源: https://www.bger.ch/files/live/sites/bger/files/pdf/de/urteilsveroeffentlichung_d.pdf

引文信息

请引用我们的 ArXiv-Preprint

@misc{rasiah2023scale,
      title={SCALE: Scaling up the Complexity for Advanced Language Model Evaluation}, 
      author={Vishvaksenan Rasiah and Ronja Stern and Veton Matoshi and Matthias Stürmer and Ilias Chalkidis and Daniel E. Ho and Joel Niklaus},
      year={2023},
      eprint={2306.09237},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

贡献

感谢 Joel Niklaus 添加了这个数据集。