数据集:

bertin-project/alpaca-spanish

英文

BERTIN 羊驼西班牙语

该数据集是 alpaca_data_cleaned.json 的西班牙语翻译,是 Alpaca dataset made at Stanford 的干净版本。

一个 earlier version 使用了 Facebook's NLLB 1.3B model ,但是当前版本使用的是 OpenAI 的 gpt-3.5-turbo ,因此该数据集不能用于创建任何与 OpenAI 竞争的模型。