数据集:

poem_sentiment

语言:

en

计算机处理:

monolingual

大小:

1K<n<10K

语言创建人:

found

批注创建人:

expert-generated

源数据集:

original

预印本库:

arxiv:2011.02686

许可:

cc-by-4.0
英文

Gutenberg诗歌数据集的数据卡片

数据集摘要

Poem Sentiment是来自项目古腾堡的诗歌诗句的情感数据集。该数据集可用于诗歌的情感分类或风格转换等任务。

支持的任务和排行榜

[需要更多信息]

语言

数据集中的文本为英文(en)。

数据集结构

数据实例

数据集中的一个示例。

{'id': 0, 'label': 2, 'verse_text': 'with pale blue berries. in these peaceful shades--'}

数据字段

  • id : 示例的索引
  • verse_text : 诗句的文本
  • label : 情感标签。这里
    • 0 = 负面
    • 1 = 正面
    • 2 = 无影响
    • 3 = 混合(既有负面又有正面)

      注意:原始数据集使用不同的标签索引(负面 = -1,无影响 = 0,正面 = 1)

数据拆分

数据集被拆分为训练集、验证集和测试集,其大小如下:

train validation test
Number of examples 892 105 104

[需要更多信息]

数据集创建

策划理由

[需要更多信息]

源数据

[需要更多信息]

初始数据收集和规范化

[需要更多信息]

资源语言产生者是谁?

[需要更多信息]

注释

[需要更多信息]

注释过程

[需要更多信息]

注释者是谁?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据的注意事项

数据的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

其他信息

数据集策划者

[需要更多信息]

许可信息

该作品采用 署名 4.0 国际 许可协议 进行许可

引用信息

@misc{sheng2020investigating,
      title={Investigating Societal Biases in a Poetry Composition System},
      author={Emily Sheng and David Uthus},
      year={2020},
      eprint={2011.02686},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

贡献

感谢 @patil-suraj 添加此数据集。