数据集:

rcds/swiss_rulings

英文

Swiss Rulings数据集卡片

数据集概述

SwissRulings是一个多语言和历时的数据集,包含了63.7万个瑞士联邦最高法院(FSCS)的案例。该数据集可以用于在瑞士法律数据上预训练自然语言模型。

支持的任务和排行榜

语言

瑞士有四种官方语言,其中德语、法语和意大利语是被代表的语言。裁决书的撰写语言取决于诉讼过程中使用的语言。

Language Subset Number of Documents Full
German de 319K
French fr 246K
Italian it 71K

数据集结构

数据字段

decision_id (string)
facts (string)
considerations (string)
origin_facts (string)
origin_considerations (string)
law_area (string)
language (string)
year (int32)
court (string)
chamber (string)
canton (string)
region (string)

数据实例

[需要更多信息]

数据字段

[需要更多信息]

数据拆分

数据集创建

策划理由

来源数据

原始数据以未经处理的HTML格式(HTML)发布,来自瑞士联邦最高法院( https://www.bger.ch )。这些文件从Entscheidsuche门户网站( https://entscheidsuche.ch )以HTML格式下载。

谁是源语言生成者?

裁决书是由法官和书记员以诉讼过程所用的语言撰写的。

标注

标注过程中谁是标注者?

元数据由瑞士联邦最高法院( https://www.bger.ch )发布。

个人和敏感信息

该数据集包含来自瑞士联邦最高法院的公开可用裁决书。根据以下指南,法院在发布之前对个人或敏感信息进行了匿名处理: https://www.bger.ch/home/juridiction/anonymisierungsregeln.html

使用数据的注意事项

数据集的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

其他信息

数据集策划者

[需要更多信息]

许可信息

我们以CC-BY-4.0的许可发布数据,符合法院许可( https://www.bger.ch/files/live/sites/bger/files/pdf/de/urteilsveroeffentlichung_d.pdf )©瑞士联邦最高法院, 2002-2022。

本网站的编辑内容和编撰的文字版权归瑞士联邦最高法院所有,根据知识共享署名4.0国际许可条款授权。这意味着您可以重新使用内容,但您必须承认来源并指明您所做的任何更改。来源: https://www.bger.ch/files/live/sites/bger/files/pdf/de/urteilsveroeffentlichung_d.pdf

引用信息

请引用我们的 ArXiv-Preprint

@misc{rasiah2023scale,
      title={SCALE: Scaling up the Complexity for Advanced Language Model Evaluation}, 
      author={Vishvaksenan Rasiah and Ronja Stern and Veton Matoshi and Matthias Stürmer and Ilias Chalkidis and Daniel E. Ho and Joel Niklaus},
      year={2023},
      eprint={2306.09237},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

贡献