数据集:

Paul/hatecheck-german

任务:

子任务:

语言:

计算机处理:

大小:

语言创建人:

批注创建人:

源数据集:

预印本库:

许可:

多语言HateCheck数据集卡片

数据集描述

多语言HateCheck（MHC）是一套针对10种不同语言的仇恨言论检测模型的功能测试套件，包括阿拉伯语、荷兰语、法语、德语、印地语、意大利语、普通话、波兰语、葡萄牙语和西班牙语。每种语言都有25多个功能测试，对应于不同类型的仇恨和具有挑战性的非仇恨。这使得可以有针对性地了解模型的性能。

详细信息请参考我们在2022年NAACL的在线虐待和伤害（WOAH）研讨会上发表的有关MHC的论文。如果您正在使用MHC，请引用我们的工作！

论文: Röttger等人（2022年）《多语言HateCheck：多语言仇恨言论检测模型的功能测试》 https://arxiv.org/abs/2206.09917
存储库: https://github.com/rewire-online/multilingual-hatecheck
联系人: paul@rewire.online

csv格式大部分与原始的HateCheck数据相匹配，但针对特定语言进行了一些调整。

mhc_case_id 测试用例的唯一标识符，适用于每个语言的每个测试用例（例如，“mandarin-1305”）

functionality 测试用例所测试功能的简写（例如，“target_obj_nh”），所有语言都测试相同的功能，但对于中文和阿拉伯语，由于非拉丁文字需要根据拼写变体进行调整。

test_case 测试用例文本。

label_gold 测试用例的黄金标签（“仇恨”或“非仇恨”）。给定功能中的所有测试用例具有相同的黄金标签。

target_ident 如果适用，指定在测试用例中被针对或提及的受保护群体。所有HateCheck涵盖七个受攻击群体，但它们的组成在不同语言中有所不同。

ref_case_id 对于具有仇恨情绪的情况，如果适用，将生成此测试用例的被扰动的仇恨用例的ID。对于非仇恨的情况，如果适用，将与此测试用例进行对比的仇恨用例的ID。

ref_templ_id 与ref_case_id相当，但用于模板ID。

templ_id 生成测试用例的模板的ID。

case_templ 生成测试用例的模板（如果适用）。

gender_male 和 gender_female 对于有性别变化的语言（法语、西班牙语、葡萄牙语、印地语、阿拉伯语、意大利语、波兰语、德语），仅在性别变化相关的情况下，性别男性和性别女性的分别条目替换了case_templ。

label_annotated 三位评审员对测试用例给出的标签列表（例如，“['仇恨'，'仇恨'，'仇恨']”）。

label_annotated_maj 三位评审员的多数票（例如，“仇恨”）。在某些情况下，这与我们的语言专家给出的黄金标签不同。

disagreement_in_case 如果label_annotated_maj与label_gold不匹配，则为true。

disagreement_in_template 如果测试用例是从IDENT模板生成的，并且至少有一个具有disagreement_in_case的测试用例从相同的模板生成。这可以用于在MHC中排除整个模板。

作者:

Paul

数据集大小:

867.77 KB