数据集:

rcds/swiss_leading_decisions

计算机处理:

multilingual

大小:

10K<n<100K

语言创建人:

expert-generated

批注创建人:

machine-generated

源数据集:

original

预印本库:

arxiv:2306.09237
英文

Swiss Leading Decisions 数据集卡片

数据集摘要

Swiss Leading Decisions是一个多语言、历时的数据集,包含21K个瑞士联邦最高法院(FSCS)的案例。该数据集是一个有挑战性的文本分类任务的一部分。我们还提供了附加的元数据,如出版年份、法律领域和每个案例的原产地州,以促进对法律自然语言处理这一关键领域的鲁棒性和公平性研究。

支持的任务和排行榜

Swiss Leading Decisions 对文本分类任务有帮助

语言

瑞士有四种官方语言,其中德语、法语和意大利语被代表。裁决的语言是法庭审理语言。

Language Subset Number of Documents
German de 14K
French fr 6K
Italian it 1K

数据集结构

数据字段

decision_id: (str) a unique identifier of the for the document
language: (int64) one of (0,1,2)
chamber_id: (int64) id to identfy chamber
file_id: (int64) id to identify file
date: (int64)
topic: (string)
year: (float64)
language: (string)
facts: (string) text section of the full text
facts_num_tokens_bert: (int64)
facts_num_tokens_spacy: (int64)
considerations: (string) text section of the full text
considerations_num_tokens_bert: (int64)
considerations_num_tokens_spacy: (int64)
rulings: (string)  text section of the full text
rulings_num_tokens_bert: (int64)
rulings_num_tokens_spacy: (int64)
chamber (string):
court: (string)
canton: (string)
region: (string)
file_name: (string)
html_url: (string)
pdf_url: (string)
file_number: (string)

数据实例

[需要更多信息]

数据字段

[需要更多信息]

数据拆分

数据集创建

策划理念

该数据集由Stern(2023)创建。

来源数据

数据收集和规范化

原始数据以未经处理的HTML格式(HTML)从瑞士联邦最高法院( https://www.bger.ch )发布。这些文件从Entscheidsuche门户( https://entscheidsuche.ch )以HTML形式下载。

谁是源语言的生产者?

裁决是由法官和书记员用审判语言撰写的。

注释

注释过程 谁是注释者?

元数据是由瑞士联邦最高法院( https://www.bger.ch )发布的。

个人和敏感信息

该数据集包含来自瑞士联邦最高法院的公开可用的法庭裁决。个人或敏感信息已根据以下指南由法庭进行了匿名处理和发布: https://www.bger.ch/home/juridiction/anonymisierungsregeln.html .

使用数据的注意事项

数据的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

附加信息

数据集策划者

[需要更多信息]

许可信息

我们根据CC-BY-4.0发布这些数据,以符合法院的许可( https://www.bger.ch/files/live/sites/bger/files/pdf/de/urteilsveroeffentlichung_d.pdf )© 瑞士联邦最高法院,2002-2022

本网站的编辑内容和综合文本的版权归瑞士联邦最高法院所有,根据知识共享署名4.0国际许可协议进行许可。这意味着您可以重复使用内容,但必须注明来源并指出您所做的任何更改。来源: https://www.bger.ch/files/live/sites/bger/files/pdf/de/urteilsveroeffentlichung_d.pdf

引用信息

请引用我们的 ArXiv-Preprint

@misc{rasiah2023scale,
      title={SCALE: Scaling up the Complexity for Advanced Language Model Evaluation}, 
      author={Vishvaksenan Rasiah and Ronja Stern and Veton Matoshi and Matthias Stürmer and Ilias Chalkidis and Daniel E. Ho and Joel Niklaus},
      year={2023},
      eprint={2306.09237},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

贡献者

感谢 @Stern5497 添加此数据集。