数据集:
rcds/swiss_law_area_prediction
任务:
文本分类计算机处理:
multilingual大小:
100K<n<1M语言创建人:
expert-generated批注创建人:
machine-generated源数据集:
original许可:
cc-by-sa-4.0预印本库:
arxiv:2306.09237该数据集包含需要分类为公共法、民事法、刑事法和社交法四个主要法律领域的案例。
这些案例可以进一步分类为子领域:
"public": ['Tax', 'Urban Planning and Environmental', 'Expropriation', 'Public Administration', 'Other Fiscal'], "civil": ['Rental and Lease', 'Employment Contract', 'Bankruptcy', 'Family', 'Competition and Antitrust', 'Intellectual Property'], 'criminal': ['Substantive Criminal', 'Criminal Procedure']
法律领域预测可以用作文本分类任务。
瑞士有四种官方语言,其中德语、法语和意大利语都有所代表。法官和书记员用所属程序语言撰写判决书。
Language | Subset | Number of Documents |
---|---|---|
German | de | 127K |
French | fr | 156K |
Italian | it | 46K |
[需要更多信息]
[需要更多信息]
[需要更多信息]
数据集按日期进行分层拆分
原始数据以未经处理的HTML格式(HTML)从瑞士联邦最高法院( https://www.bger.ch )公开发布。文件通过Entscheidsuche门户网站( https://entscheidsuche.ch )的HTML格式进行下载。
谁是源语言制作人?判决书是由法官和书记员以所属程序语言撰写的。
该数据集包含来自瑞士联邦最高法院的公开可用法院决定。根据以下指南,法院在发布前对个人或敏感信息进行了匿名化处理: https://www.bger.ch/home/juridiction/anonymisierungsregeln.html 。
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
我们根据CC-BY-4.0发布数据,该许可符合法院许可条款( https://www.bger.ch/files/live/sites/bger/files/pdf/de/urteilsveroeffentlichung_d.pdf )©瑞士联邦最高法院,2002-2022
此网站的编辑内容和汇编文本的版权归瑞士联邦最高法院所有,受Creative Commons Attribution 4.0 International许可。这意味着您可以重新使用内容,前提是您承认出处并指明您所做的任何更改。来源: https://www.bger.ch/files/live/sites/bger/files/pdf/de/urteilsveroeffentlichung_d.pdf
请引用我们的 ArXiv-Preprint
@misc{rasiah2023scale, title={SCALE: Scaling up the Complexity for Advanced Language Model Evaluation}, author={Vishvaksenan Rasiah and Ronja Stern and Veton Matoshi and Matthias Stürmer and Ilias Chalkidis and Daniel E. Ho and Joel Niklaus}, year={2023}, eprint={2306.09237}, archivePrefix={arXiv}, primaryClass={cs.CL} }