数据集:
farsi_news
https://github.com/sci2lab/Farsi-datasets 是用于机器学习任务的波斯语(波斯语)数据集,尤其是自然语言处理。这些数据集是从两个波斯语新闻机构网站的RSS提取的:
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
初始数据收集和规范化[需要更多信息]
源语言制造者是谁?[需要更多信息]
[需要更多信息]
注释过程[需要更多信息]
注释者是谁?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
https://github.com/sci2lab/Farsi-datasets
感谢 @Narsil 添加此数据集。