数据集:

Thaweewat/instruction-wild-52k-th

英文

摘要

这是一个从 InstructionWild 翻译成的??泰国指导数据集,使用了Google Cloud翻译。它包含52191个英文和51504个中文指令,这些指令是从Twitter收集而来的,用户倾向于分享他们的有趣提示,主要是生成、开放型问答和思维风暴类型,同时也被 Colossal AI 用来训练ColossalChat模型。

支持的任务:

  • 训练LLMs
  • 合成数据生成
  • 数据增强

语言: 泰语 版本: 1.0