数据集:
rcds/swiss_legislation
Swiss Legislation 是一个多语言、时变的数据集,包含 36,000 条瑞士法律法规。这个数据集是一个具有挑战性的信息检索任务的一部分。
数据集中的文本总数为 35,698。数据集以 lexfind_v2.jsonl 格式保存。瑞士有四种官方语言,即德语、法语、意大利语和罗曼什语,还涵盖了一些英语法律。法律是由法律专家编写的。36,000 & 18,000 & 11,000 & 6,000 & 534 & 207 。
Language | Subset | Number of Documents |
---|---|---|
German | de | 18K |
French | fr | 11K |
Italian | it | 6K |
Romanch | rm | 534 |
English | en | 207 |
数据集中的每个条目都是一个字典,包含以下键:
[需要更多信息]
[需要更多信息]
原始数据是来自瑞士联邦最高法院的发布( https://www.bger.ch ),以未经处理的格式(HTML)发布。文件是从 Entscheidsuche 门户( https://entscheidsuche.ch )的 HTML 中下载的。
谁是源语言的生成者?决定是由法官和书记员使用庭审语言编写的。
元数据由瑞士联邦最高法院发布( https://www.bger.ch )。
数据集包含来自瑞士联邦最高法院的公开可获取的法院决定。根据以下指导方针,法院在发布之前对个人或敏感信息进行了匿名处理: https://www.bger.ch/home/juridiction/anonymisierungsregeln.html 。
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
我们将数据以 CC-BY-4.0 许可发布,符合法院许可要求( https://www.bger.ch/files/live/sites/bger/files/pdf/de/urteilsveroeffentlichung_d.pdf )© 瑞士联邦最高法院,2002-2022
本网站的编辑内容和汇编文本的版权归瑞士联邦最高法院所有,根据知识共享署名 4.0 国际许可证发布。这意味着您可以重新使用内容,前提是您承认来源并指出您所做的任何更改。来源: https://www.bger.ch/files/live/sites/bger/files/pdf/de/urteilsveroeffentlichung_d.pdf
请引用我们的内容< ArXiv-Preprint
@misc{rasiah2023scale, title={SCALE: Scaling up the Complexity for Advanced Language Model Evaluation}, author={Vishvaksenan Rasiah and Ronja Stern and Veton Matoshi and Matthias Stürmer and Ilias Chalkidis and Daniel E. Ho and Joel Niklaus}, year={2023}, eprint={2306.09237}, archivePrefix={arXiv}, primaryClass={cs.CL} }