数据集:

Thaweewat/hc3-24k-th

英文

概述

这是一个使用Google Cloud Translation从 HC3 (包括总共24K,17K reddit_eli5,4K finance,1.2K medicine,1.2K open_qa和0.8K wiki_csai)翻译成的?? 泰语文本数据集

本文介绍了首个人-ChatGPT对比语料库:

代码、模型和分析可在GitHub上获取:

支持的任务:

  • 训练LLMs
  • 合成数据生成
  • 数据增强

语言:ThaiVersion:1.0