数据集:
Finnish-NLP/mc4_fi_cleaned
mC4 Finnish Cleaned 是原始的 mC4 Finnish 拆分数据集的清理版本。
mC4 Finnish 主要用于预训练芬兰语言模型和单词表示。
芬兰语
[需要更多信息]
数据包含多个字段:
训练集 验证集
[需要更多信息]
[需要更多信息]
资源语言的生产者是谁?[需要更多信息]
[需要更多信息]
注释者是谁?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]