数据集:

HuggingFaceH4/instruction-dataset

许可:

apache-2.0
英文

这是一份高质量、多样化的人工编写指令和演示的盲目评估数据集。我们将在我们的RLHF流水线中使用它进行第三步评估。