数据集:
rcds/swiss_leading_decisions
任务:
文本分类计算机处理:
multilingual大小:
10K<n<100K语言创建人:
expert-generated批注创建人:
machine-generated源数据集:
original许可:
cc-by-sa-4.0预印本库:
arxiv:2306.09237Swiss Leading Decisions是一个多语言、历时的数据集,包含21K个瑞士联邦最高法院(FSCS)的案例。该数据集是一个有挑战性的文本分类任务的一部分。我们还提供了附加的元数据,如出版年份、法律领域和每个案例的原产地州,以促进对法律自然语言处理这一关键领域的鲁棒性和公平性研究。
Swiss Leading Decisions 对文本分类任务有帮助
瑞士有四种官方语言,其中德语、法语和意大利语被代表。裁决的语言是法庭审理语言。
Language | Subset | Number of Documents |
---|---|---|
German | de | 14K |
French | fr | 6K |
Italian | it | 1K |
decision_id: (str) a unique identifier of the for the document language: (int64) one of (0,1,2) chamber_id: (int64) id to identfy chamber file_id: (int64) id to identify file date: (int64) topic: (string) year: (float64) language: (string) facts: (string) text section of the full text facts_num_tokens_bert: (int64) facts_num_tokens_spacy: (int64) considerations: (string) text section of the full text considerations_num_tokens_bert: (int64) considerations_num_tokens_spacy: (int64) rulings: (string) text section of the full text rulings_num_tokens_bert: (int64) rulings_num_tokens_spacy: (int64) chamber (string): court: (string) canton: (string) region: (string) file_name: (string) html_url: (string) pdf_url: (string) file_number: (string)
[需要更多信息]
[需要更多信息]
该数据集由Stern(2023)创建。
原始数据以未经处理的HTML格式(HTML)从瑞士联邦最高法院( https://www.bger.ch )发布。这些文件从Entscheidsuche门户( https://entscheidsuche.ch )以HTML形式下载。
谁是源语言的生产者?裁决是由法官和书记员用审判语言撰写的。
元数据是由瑞士联邦最高法院( https://www.bger.ch )发布的。
该数据集包含来自瑞士联邦最高法院的公开可用的法庭裁决。个人或敏感信息已根据以下指南由法庭进行了匿名处理和发布: https://www.bger.ch/home/juridiction/anonymisierungsregeln.html .
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
我们根据CC-BY-4.0发布这些数据,以符合法院的许可( https://www.bger.ch/files/live/sites/bger/files/pdf/de/urteilsveroeffentlichung_d.pdf )© 瑞士联邦最高法院,2002-2022
本网站的编辑内容和综合文本的版权归瑞士联邦最高法院所有,根据知识共享署名4.0国际许可协议进行许可。这意味着您可以重复使用内容,但必须注明来源并指出您所做的任何更改。来源: https://www.bger.ch/files/live/sites/bger/files/pdf/de/urteilsveroeffentlichung_d.pdf
请引用我们的 ArXiv-Preprint
@misc{rasiah2023scale, title={SCALE: Scaling up the Complexity for Advanced Language Model Evaluation}, author={Vishvaksenan Rasiah and Ronja Stern and Veton Matoshi and Matthias Stürmer and Ilias Chalkidis and Daniel E. Ho and Joel Niklaus}, year={2023}, eprint={2306.09237}, archivePrefix={arXiv}, primaryClass={cs.CL} }
感谢 @Stern5497 添加此数据集。