英文

注意:新版本可用。请查看更高版本的权重 here 。如果您仍然想使用这个旧版本,请查看不同版本之间的兼容性和差异 here

注意:这个“增量模型”不能直接使用。用户必须在原始LLaMA权重之上应用它,以获得实际的Vicuna权重。请参见 instructions

Vicuna模型卡片

模型详情

Vicuna是一个由对来自ShareGPT的用户共享对话进行细调的LLaMA训练的聊天助手。

  • 开发者: LMSYS
  • 模型类型:基于Transformer架构的自回归语言模型。
  • 许可证:非商业许可证
  • 从模型进行微调: LLaMA

模型来源

用途

Vicuna的主要用途是研究大型语言模型和聊天机器人。该模型的主要用户是自然语言处理、机器学习和人工智能领域的研究人员和爱好者。

如何开始使用该模型

命令行界面: https://github.com/lm-sys/FastChat#vicuna-weights 。API(OpenAI API,Huggingface API): https://github.com/lm-sys/FastChat/tree/main#api

训练详情

Vicuna v0是通过监督指令微调从LLaMA获得的。训练数据大约有70K个从ShareGPT.com收集的对话。请参阅附录中“Vicuna模型的训练详情”部分中的更多细节 paper

评估

Vicuna使用标准基准、人类偏好和LLM作为评判进行评估。请参阅 paper leaderboard 中的更多细节。

Vicuna的不同版本之间的差异

请参阅 vicuna_weights_version.md