数据集:

laugustyniak/abusive-clauses-pl

语言:

pl

计算机处理:

monolingual

语言创建人:

found

批注创建人:

hired_annotators
英文

PAC - 波兰不公平条款数据集

“我已阅读并同意条款和条件”是互联网上最大的谎言之一。消费者很少阅读他们必须接受的合同。我们每天在网上达成协议。但我们了解这些协议的内容吗?我们是否检查潜在的不公平陈述?在互联网上,我们可能会跳过大部分条款和条件。但是,我们必须记住我们已经达成了更多的合同。想象一下,我们想买房子、买车、把孩子送到幼儿园、开银行账户或者其他很多情况。在所有这些情况下,你都需要签订合同,但是很有可能你不会完整地阅读合同并正确理解其中的内容。欧洲消费者法旨在防止企业在其单方面起草的合同中使用所谓的“不公平合同条款”,要求消费者接受这些条款。

我们的数据集将“不公平合同条款”视为滥用条款的等同物。它可以定义为一条由合同当事方单方面强加的条款,不平等地影响另一方,或者在当事方的权利和义务之间创造一种不平衡的情况。

在欧盟和国家层面(如波兰),机构无法手动检查可能的协议。因此,我们采取了第一步来评估加快该过程的可能性。我们创建了一个数据集和机器学习模型,部分自动化检测潜在的滥用条款。消费者保护组织和机构可以利用这些资源使他们的工作更加有效和高效。此外,消费者可以自动分析合同并了解自己所同意的内容。

任务(输入、输出和指标)

滥用条款检测

输入('text'列):协议的文本

输出('label'列):二进制标签(BEZPIECZNE_POSTANOWIENIE_UMOWNE:正确的协议陈述,KLAUZULA_ABUZYWNA:滥用条款)

领域:法律协议

测量指标:准确度,F1宏平均

示例:

输入:Wszelka korespondencja wysyłana przez Pożyczkodawcę na adres zamieszkania podany w umowie oraz na e-mail zostaje uznana za skutecznie doręczoną. Zmiana adresu e-mail oraz adresu zamieszkania musi być dostarczona do Pożyczkodawcy osobiście

输入(由DeepL翻译):所有由借款人寄往协议中提供的住所地址和电子邮件地址的信件被视为有效送达。更改电子邮件地址和住所地址必须亲自送达给借款人

输出:KLAUZULA_ABUZYWNA(滥用条款)

数据拆分

Subset Cardinality (sentences)
train 4284
dev 1519
test 3453

类别分布

BEZPIECZNE_POSTANOWIENIE_UMOWNE - 表示正确的协议陈述。

KLAUZULA_ABUZYWNA向我们指出滥用条款。

Class train dev test
BEZPIECZNE_POSTANOWIENIE_UMOWNE 0.5458 0.3002 0.6756
KLAUZULA_ABUZYWNA 0.4542 0.6998 0.3244

许可协议

Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)

引用

@inproceedings{NEURIPS2022_890b206e,
 author = {Augustyniak, Lukasz and Tagowski, Kamil and Sawczyn, Albert and Janiak, Denis and Bartusiak, Roman and Szymczak, Adrian and Janz, Arkadiusz and Szyma\'{n}ski, Piotr and W\k{a}troba, Marcin and Morzy, Miko\l aj and Kajdanowicz, Tomasz and Piasecki, Maciej},
 booktitle = {Advances in Neural Information Processing Systems},
 editor = {S. Koyejo and S. Mohamed and A. Agarwal and D. Belgrave and K. Cho and A. Oh},
 pages = {21805--21818},
 publisher = {Curran Associates, Inc.},
 title = {This is the way: designing and compiling LEPISZCZE, a comprehensive NLP benchmark for Polish},
 url = {https://proceedings.neurips.cc/paper_files/paper/2022/file/890b206ebb79e550f3988cb8db936f42-Paper-Datasets_and_Benchmarks.pdf},
 volume = {35},
 year = {2022}
}