数据集:
HuggingFaceH4/helpful_instructions
帮助指南是一个由公共数据集衍生而来的(指令,完成)对的数据集。顾名思义,它着重于“有帮助的”指令,即人类用户可能给AI助手的指令或任务。您可以按以下方式加载数据集:
from datasets import load_dataset # Load all subsets helpful_instructions = load_dataset("HuggingFaceH4/helpful_instructions", name="all") # Load a single subset helpful_instructions_subset = load_dataset("HuggingFaceH4/helpful_instructions", name="self_instruct")
该数据集可用于微调预训练的语言模型以遵循指令。