数据集:
rcds/swiss_rulings
SwissRulings是一个多语言和历时的数据集,包含了63.7万个瑞士联邦最高法院(FSCS)的案例。该数据集可以用于在瑞士法律数据上预训练自然语言模型。
瑞士有四种官方语言,其中德语、法语和意大利语是被代表的语言。裁决书的撰写语言取决于诉讼过程中使用的语言。
Language | Subset | Number of Documents Full |
---|---|---|
German | de | 319K |
French | fr | 246K |
Italian | it | 71K |
decision_id (string) facts (string) considerations (string) origin_facts (string) origin_considerations (string) law_area (string) language (string) year (int32) court (string) chamber (string) canton (string) region (string)
[需要更多信息]
[需要更多信息]
原始数据以未经处理的HTML格式(HTML)发布,来自瑞士联邦最高法院( https://www.bger.ch )。这些文件从Entscheidsuche门户网站( https://entscheidsuche.ch )以HTML格式下载。
谁是源语言生成者?裁决书是由法官和书记员以诉讼过程所用的语言撰写的。
元数据由瑞士联邦最高法院( https://www.bger.ch )发布。
该数据集包含来自瑞士联邦最高法院的公开可用裁决书。根据以下指南,法院在发布之前对个人或敏感信息进行了匿名处理: https://www.bger.ch/home/juridiction/anonymisierungsregeln.html 。
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
我们以CC-BY-4.0的许可发布数据,符合法院许可( https://www.bger.ch/files/live/sites/bger/files/pdf/de/urteilsveroeffentlichung_d.pdf )©瑞士联邦最高法院, 2002-2022。
本网站的编辑内容和编撰的文字版权归瑞士联邦最高法院所有,根据知识共享署名4.0国际许可条款授权。这意味着您可以重新使用内容,但您必须承认来源并指明您所做的任何更改。来源: https://www.bger.ch/files/live/sites/bger/files/pdf/de/urteilsveroeffentlichung_d.pdf
请引用我们的 ArXiv-Preprint 。
@misc{rasiah2023scale, title={SCALE: Scaling up the Complexity for Advanced Language Model Evaluation}, author={Vishvaksenan Rasiah and Ronja Stern and Veton Matoshi and Matthias Stürmer and Ilias Chalkidis and Daniel E. Ho and Joel Niklaus}, year={2023}, eprint={2306.09237}, archivePrefix={arXiv}, primaryClass={cs.CL} }