数据集:

cdt

语言:

pl

计算机处理:

monolingual

大小:

10K<n<100K

语言创建人:

other

批注创建人:

expert-generated

源数据集:

original
英文

[数据集名字] 的数据集卡片

数据集摘要

Cyberbullying Detection(网络欺凌检测)任务是2019年PolEval竞赛的一部分。其目标是预测给定的推特消息是否包含网络欺凌(有害)内容。

支持的任务和排行榜

[需要更多信息]

语言

波兰语

数据集结构

数据实例

[需要更多信息]

数据字段

  • sentence: 一个匿名的波兰语推特
  • target: 如果推特被描述为欺凌,则为1,否则为0。测试集没有标签,所以使用-1代替。

数据划分

[需要更多信息]

数据集创建

策划理由

[需要更多信息]

源数据

初始数据收集和规范化

[需要更多信息]

语言来源的制作者是谁?

[需要更多信息]

注释

注释过程

[需要更多信息]

注释者是谁?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据的注意事项

数据的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

附加信息

数据集负责人

[需要更多信息]

许可信息

BSD 3-Clause

引用信息

[需要更多信息]

贡献

感谢 @abecadel 为添加此数据集。