数据集:

newsph

英文

NewsPH数据集卡片

数据集摘要

在闵尼拉等学者的《2020年新闻》中,它是菲律宾语的原始新闻文章集合。

支持的任务和排行榜

[需要更多信息]

语言

泰加洛语/菲律宾语

数据集结构

数据示例

[需要更多信息]

数据字段

  • 文本 (str)

数据集以纯文本形式存在,只有一个字段("text")。可以用于语言建模。

数据拆分

[需要更多信息]

数据集创建

策划理念

[需要更多信息]

来源数据

数据收集和归一化

[需要更多信息]

谁是源语言制作者?

[需要更多信息]

注释

注释过程

[需要更多信息]

谁是注释者?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据的考虑事项

数据的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

附加信息

数据集策划者

[需要更多信息]

许可信息

[需要更多信息]

引用信息

[需要更多信息]

贡献

感谢 @jcblaisecruz02 添加了该数据集。