数据集:

mteb/reddit-clustering-p2p

语言:

en
英文

有以下10组统计数据:

  • 91个标签和15592个样本
  • 64个标签和79172个样本
  • 38个标签和1942个样本
  • 11个标签和13224个样本
  • 64个标签和92303个样本
  • 87个标签和28607个样本
  • 10个标签和69146个样本
  • 48个标签和67469个样本
  • 64个标签和29683个样本
  • 31个标签和62261个样本
  • 使用mteb github存储库上提供的脚本随机选择的。