数据集:
TigerResearch/tigerbot-dolly-classification-en-2k
语言:
许可:
Tigerbot 基于dolly数据集加工的分类classification相关分类的的sft。
原始来源: https://huggingface.co/datasets/databricks/databricks-dolly-15k
databricks-dolly-15k是一个开源数据集,记录了数千名Databricks员工在InstructGPT论文中概述的行为类别中生成的按指示执行记录。
import datasets ds_sft = datasets.load_dataset('TigerResearch/tigerbot-dolly-classification-en-2k')