英文

Vicuna 模型卡片

模型详情

Vicuna 是一个由在 ShareGPT 上收集到的用户对话进行微调后训练的聊天助手。

  • 开发者: LMSYS
  • 模型类型:基于Transformer架构的自回归语言模型。
  • 许可证:非商业许可证
  • 从模型进行微调: LLaMA

模型来源

使用

Vicuna 的主要用途是研究大型语言模型和聊天机器人。模型的主要预期使用者是自然语言处理、机器学习和人工智能领域的研究人员和爱好者。

如何开始使用模型

训练细节

Vicuna v1.3 是通过监督式指令微调从LLaMA微调而来的。训练数据包括来自ShareGPT.com的约14万个对话。有关更多详细信息,请参阅附录中的"Vicuna模型的训练细节"部分 paper

评估

Vicuna 使用标准基准测试、人类偏好和LLM作为评判来进行评估。有关更多详细信息,请参阅 paper leaderboard

不同版本的Vicuna之间的差异

请参阅 vicuna_weights_version.md