数据集:

khalidalt/HuffPost

许可:

cc0-1.0
英文

HuffPost 数据集卡片

数据集摘要

这是一个由 HuffPost 收集的约200K条新闻标题数据集,涵盖了2012年至2018年的内容。

支持的任务和排行榜

[需要更多信息]

语言

[需要更多信息]

数据集结构

数据示例

[需要更多信息]

数据字段

[需要更多信息]

数据划分

[需要更多信息]

数据集创建

策划理由

[需要更多信息]

源数据

初始数据收集和归一化

[需要更多信息]

谁是源语言的生产者?

[需要更多信息]

标注信息

标注流程

[需要更多信息]

谁是标注者?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据的注意事项

数据的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

附加信息

数据集策划者

[需要更多信息]

许可信息

许可证: cc0-1.0

引用信息

@book{book,
  author = {Misra, Rishabh and Grover, Jigyasa},
  year = {2021},
  month = {01},
  pages = {},
  title = {Sculpting Data for ML: The first act of Machine Learning},
  isbn = {978-0-578-83125-1}
}

@dataset{dataset,
  author = {Misra, Rishabh},
  year = {2018},
  month = {06},
  pages = {},
  title = {News Category Dataset},
  doi = {10.13140/RG.2.2.20331.18729}
}

贡献者

感谢 @github-username 添加了这个数据集。