数据集:

polemo2

语言:

pl

计算机处理:

monolingual

大小:

1K<n<10K

语言创建人:

other

批注创建人:

expert-generated

源数据集:

original
英文

数据集名称:PolEmo2.0数据集

数据集概述

PolEmo2.0数据集是来自医药和酒店领域的在线评论集合。任务是预测评论的情绪。数据集包含两个独立的测试集,一个用于领域内(医药和酒店),另一个用于领域外(产品和大学)的验证。

支持的任务和排行榜

【需要更多信息】

语言

波兰语

数据集结构

数据实例

【需要更多信息】

数据字段

  • 句子:字符串,评论
  • 目标:句子的情绪类别

在plWordNet Emo中使用相同的标签系统来表示词汇单元的情绪:[+m](强正面),[+s](弱正面),[-m](强负面),[-s](弱负面),[amb](模糊)和[0](中性)。

请注意,测试集没有目标值,因此使用-1表示。

数据切分

【需要更多信息】

数据集创建

策划原因

【需要更多信息】

源数据

数据采集和归一化

【需要更多信息】

源语言制造者是谁?

【需要更多信息】

注释

注释过程

【需要更多信息】

注释者是谁?

【需要更多信息】

个人和敏感信息

【需要更多信息】

使用数据的注意事项

数据集的社会影响

【需要更多信息】

偏见讨论

【需要更多信息】

其他已知限制

此数据集仅供研究目的使用。请查看数据集许可证获取更多信息。

附加信息

数据集创建者

【需要更多信息】

许可信息

CC BY-NC-SA 4.0

引用信息

【需要更多信息】

贡献者

感谢 @abecadel 添加此数据集。