模型:

PygmalionAI/pygmalion-350m

英文

pygmalion-350m

模型描述

这是Facebook OPT-350M模型的一个概念验证版本,经过对话优化,用作更高参数模型的基础。

免责声明:NSFW数据在这个模型的微调中有所包含。虽然安全输入通常会产生安全输出,但请自行承担聊天的风险。该模型不适用于未成年人使用。

微调过程

创建这个模型比预期的要容易得多。

我们使用了 ColossalAI 库对 OPT-350M 模型进行微调,该模型最初是由Facebook在The Pile上进行训练的。尽管我们最初的数据集是从各种来源收集的对话集合,总大小约为50MB,但早期的训练运行结果显示,仅通过数据集的7%后,模型就已收敛。为了缓解这个问题,我们将数据集的大小大大减小,仅为273KB。

ColossalAI的神奇之处在于:整个模型只在一张仅有6GB (!) VRAM的GPU上进行微调。微调过程仅需不到一个小时完成。