数据集:
Thaweewat/databricks-dolly-15k-th
这是使用谷歌云翻译从databricks-dolly-15k翻译而来的一份泰语-指示数据集。databricks-dolly-15k是一个开源数据集,其中包含了数千名Databricks员工根据《InstructGPT》论文中概述的几个行为类别生成的遵循指示的记录,包括头脑风暴、分类、封闭问答、生成、信息提取、开放问答和摘要。
这个数据集可以用于任何目的,无论是学术还是商业,符合 Creative Commons Attribution-ShareAlike 3.0 Unported License 的条款。
支持的任务:
语言:泰语版本:1.0