数据集:

lucasmccabe-lmi/FLAN_CoT_alpaca_style

预印本库:

arxiv:2210.11416
英文

"FLAN_CoT_alpaca_style"数据集卡片

我们提供了一份数据集,代表了来自 FLAN 的9个链式思考(推理)微调任务。我们对其进行了轻微的格式化处理:

  • 我们采用了Alpaca风格的格式(即指令/输入/输出字段)
  • 如果问题是多项选择题,则选项将放在输入字段中
  • 在指令字段末尾添加了短语“在提供正确答案之前,请逐步解释您的推理过程。”

数字:

提示:74771

符记:9016176,使用EleutherAI/gpt-neox-20b tokenizer进行计数(包括指令+输入+输出)