数据集:

rcds/swiss_court_view_generation

英文

Swiss Court View Generation 数据集卡

数据集概述

Swiss Court View Generation 是一个包含404K瑞士联邦最高法院(FSCS)案例的多语言、历时数据集。该数据集是一个具有挑战性的文本生成任务的一部分。该数据集包含不同语言和法庭的法院观点。它包括决定ID、语言、法庭、文件名、URL以及事实和考虑部分的标记数等信息。主要(L1)包含所有数据,原始(L2)仅包含具有完整起源事实和起源考虑的数据。

支持的任务和排行榜

语言

瑞士有四种官方语言,其中德语、法语和意大利语被表示出来。法官和书记员会用诉讼语言撰写判决书。

Language Subset Number of Documents Main Number of Documents Origin
German de 197K 49
French fr 163K 221
Italian it 44K 0

数据集结构

数据字段

decision_id (string)
facts (string)
considerations (string)
origin_facts (string)
origin_considerations (string)
law_area (string)
language (string)
year (int32)
court (string)
chamber (string)
canton (string)
region (string)

数据实例

[需要更多信息]

数据字段

[需要更多信息]

数据分割

数据集创建

策划理由

源数据

初始数据收集和规范化

原始数据以未经处理的HTML格式(HTML)发布,从 Entscheidsuche 门户( https://entscheidsuche.ch )下载而来。

谁是源语言生产者?

法官和书记员会用诉讼语言撰写判决书。

注释

注释过程 谁是注释者?

元数据由瑞士联邦最高法院( https://www.bger.ch )发布。

个人和敏感信息

该数据集包含来自瑞士联邦最高法院的公开可用法院判决。根据以下准则,法院在发布之前对个人或敏感信息进行了匿名处理: https://www.bger.ch/home/juridiction/anonymisierungsregeln.html .

使用数据的注意事项

数据的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

附加信息

数据集维护者

[需要更多信息]

许可信息

我们根据CC-BY-4.0发布数据,该数据符合法庭许可( https://www.bger.ch/files/live/sites/bger/files/pdf/de/urteilsveroeffentlichung_d.pdf )© 瑞士联邦最高法院,2002-2022

本网站的编辑内容版权和编纂数据版权归瑞士联邦最高法院所有,根据《知识共享署名4.0国际协议》进行许可。这意味着您可以重新使用该内容,但必须标明出处并指明您所做的任何更改。来源: https://www.bger.ch/files/live/sites/bger/files/pdf/de/urteilsveroeffentlichung_d.pdf

引用信息

请引用我们的 ArXiv-Preprint

@misc{rasiah2023scale,
      title={SCALE: Scaling up the Complexity for Advanced Language Model Evaluation}, 
      author={Vishvaksenan Rasiah and Ronja Stern and Veton Matoshi and Matthias Stürmer and Ilias Chalkidis and Daniel E. Ho and Joel Niklaus},
      year={2023},
      eprint={2306.09237},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

贡献