数据集:

rcds/swiss_judgment_prediction_xl

英文

Swiss Court View Generation数据集卡片

数据集摘要

Swiss Judgment Prediction是一个多语言、历时的数据集,包含了329K瑞士联邦最高法院(FSCS)的案例。该数据集是一个具有挑战性的文本生成任务的一部分。

支持的任务和排行榜

语言

瑞士有四种官方语言,其中德语、法语和意大利语代表了三种语言。判决书由法官和书记员用诉讼语言编写。

Language Subset Number of Documents Full
German de 160K
French fr 128K
Italian it 41K

数据集结构

数据字段

- decision_id: unique identifier for the decision
- facts: facts section of the decision
- considerations: considerations section of the decision
- label: label of the decision
- law_area: area of law of the decision
- language: language of the decision
- year: year of the decision
- court: court of the decision
- chamber: chamber of the decision
- canton: canton of the decision
- region: region of the decision

数据示例

[需要更多信息]

数据字段

[需要更多信息]

数据拆分

数据集创建

策划理由

源数据

初始数据收集与规范化

原始数据以未经处理的HTML格式( https://www.bger.ch )从瑞士联邦最高法院获取。这些文件是从Entscheidsuche门户( https://entscheidsuche.ch )以HTML格式下载的。

谁是源语言的生产者?

判决书由法官和书记员以诉讼语言编写。

标注

注释过程 谁是标注者?

元数据由瑞士联邦最高法院( https://www.bger.ch )发布。

个人和敏感信息

该数据集包含瑞士联邦最高法院公开的判决书。按照以下指南,法院在发布前对个人或敏感信息进行了匿名处理: https://www.bger.ch/home/juridiction/anonymisierungsregeln.html

使用数据时的注意事项

数据集的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

附加信息

数据集策划者

[需要更多信息]

许可信息

我们在CC-BY-4.0下发布数据,符合法庭许可( https://www.bger.ch/files/live/sites/bger/files/pdf/de/urteilsveroeffentlichung_d.pdf )©瑞士联邦最高法院,2002-2022

本网站的编辑内容和合并文本的版权归瑞士联邦最高法院所有,根据知识共享署名4.0国际许可协议进行许可。这意味着您可以重新使用内容,但必须确认出处并指出您所做的任何更改。来源: https://www.bger.ch/files/live/sites/bger/files/pdf/de/urteilsveroeffentlichung_d.pdf

引用信息

请引用我们的 ArXiv-Preprint

@misc{rasiah2023scale,
      title={SCALE: Scaling up the Complexity for Advanced Language Model Evaluation}, 
      author={Vishvaksenan Rasiah and Ronja Stern and Veton Matoshi and Matthias Stürmer and Ilias Chalkidis and Daniel E. Ho and Joel Niklaus},
      year={2023},
      eprint={2306.09237},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

贡献