数据集:

farsi_news

语言:

fa

计算机处理:

monolingual

大小:

1K<n<10K

语言创建人:

found

批注创建人:

found

源数据集:

original
英文

FarsiNews 数据集卡片

数据集概要

https://github.com/sci2lab/Farsi-datasets 是用于机器学习任务的波斯语(波斯语)数据集,尤其是自然语言处理。这些数据集是从两个波斯语新闻机构网站的RSS提取的:

  • Hamshahri
  • RadioFarda

支持的任务和排行榜

[需要更多信息]

语言

[需要更多信息]

数据集结构

[需要更多信息]

数据实例

[需要更多信息]

数据字段

[需要更多信息]

数据拆分

[需要更多信息]

数据集创建

策划理由

[需要更多信息]

数据源

[需要更多信息]

初始数据收集和规范化

[需要更多信息]

源语言制造者是谁?

[需要更多信息]

注释

[需要更多信息]

注释过程

[需要更多信息]

注释者是谁?

[需要更多信息]

个人和敏感信息

[需要更多信息]

使用数据的注意事项

数据的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

其他信息

数据集策划者

[需要更多信息]

许可信息

[需要更多信息]

引用信息

https://github.com/sci2lab/Farsi-datasets

贡献

感谢 @Narsil 添加此数据集。