数据集:

TigerResearch/tigerbot-dolly-classification-en-2k

语言:

en

许可:

apache-2.0
英文

Tigerbot 基于dolly数据集加工的分类classification相关分类的的sft。

原始来源: https://huggingface.co/datasets/databricks/databricks-dolly-15k

databricks-dolly-15k是一个开源数据集,记录了数千名Databricks员工在InstructGPT论文中概述的行为类别中生成的按指示执行记录。

Usage

import datasets
ds_sft = datasets.load_dataset('TigerResearch/tigerbot-dolly-classification-en-2k')