英文

Vicuna 模型卡片

模型详情

Vicuna 是一个聊天助手,通过在 ShareGPT 上收集的用户对话进行精调,基于 LLaMA 进行训练。

  • 开发者: LMSYS
  • 模型类型:基于 Transformer 架构的自回归语言模型
  • 许可证:非商业许可证
  • 经过精调的模型: LLaMA

模型来源

应用

Vicuna 的主要用途是研究大型语言模型和聊天机器人。该模型的主要目标用户是自然语言处理、机器学习和人工智能领域的研究人员和爱好者。

如何开始使用模型

训练详情

Vicuna v1.3 是通过有监督指令精调从 LLaMA 获得的。训练数据来自 ShareGPT.com 收集的约 140,000 个对话。有关更多详细信息,请参阅附录中的“Vicuna 模型的训练详情”部分 paper

评估

Vicuna 使用标准基准、人类偏好和 LLM 作为评判进行评估。更多详细信息,请参阅 paper leaderboard

不同版本的 Vicuna 之间的差异

请参阅 vicuna_weights_version.md