数据集:

lucasmccabe-lmi/CodeAlpaca-20k

英文

"CodeAlpaca-20k" 数据集卡片

我们对 CodeAlpaca-20k 数据集进行了微小的修改。具体而言,如果意图语言没有明确指定,我们会添加短语"用Python编写相应的代码。"

数量:

提示: 20022

Tokens: 1561716,使用了 EleutherAI/gpt-neox-20b 分词器(包括指令+输入+输出)