数据集:

catalonia_independence

语言:

ca es

计算机处理:

monolingual

大小:

10K<n<100K

语言创建人:

crowdsourced

批注创建人:

expert-generated

源数据集:

original
英文

Catalonia Independence Corpus 数据集卡片

数据集概要

此数据集包含西班牙语和加泰罗尼亚语的两个语料库,包含经过注释的用于自动立场检测的Twitter消息。数据集在2019年2月和3月期间收集于巴塞罗那的发布的推文,并且在2018年9月期间从加泰罗尼亚城市Terrassa的推文中收集。

每个语料库都被注释为三个类别:AGAINST,FAVOR和NEUTRAL,表达了对目标- 加泰罗尼亚独立的立场。

支持的任务和排行榜

【需要更多信息】

语言

西班牙语和加泰罗尼亚语

数据集结构

数据实例

【需要更多信息】

数据字段

【需要更多信息】

数据拆分

【需要更多信息】

数据集创建

策划理由

【需要更多信息】

源数据

初始数据收集和规范化

【需要更多信息】

谁是资料的语言来源制作者?

【需要更多信息】

注释

注释过程

【需要更多信息】

注释者是谁?

【需要更多信息】

个人和敏感信息

【需要更多信息】

使用数据的注意事项

数据的社会影响

【需要更多信息】

偏见讨论

【需要更多信息】

其他已知限制

【需要更多信息】

其他信息

数据集策划者

【需要更多信息】

许可信息

【需要更多信息】

引用信息

【需要更多信息】

贡献

感谢 @lewtun 添加此数据集。