模型:
lmsys/vicuna-13b-v1.1
任务:
注意:新版本已发布。请查看更新的权重 here 。如果您仍然希望使用此旧版本,请参阅不同版本之间的兼容性和差异 here 。
Vicuna 是通过对从 ShareGPT 收集的用户共享对话进行 LLaMA 微调而训练出来的聊天助手。
Vicuna 的主要用途是用于大型语言模型和聊天机器人的研究。模型的主要用户是自然语言处理、机器学习和人工智能领域的研究人员和爱好者。
命令行界面: https://github.com/lm-sys/FastChat#vicuna-weights 。API(OpenAI API、Huggingface API): https://github.com/lm-sys/FastChat/tree/main#api 。
Vicuna v1.1 是通过使用受监督指令微调从 LLaMA 得到的数据进行微调的。训练数据大约有 70,000 个从 ShareGPT.com 收集的对话。有关更多详细信息,请参阅附录中的 "Vicuna 模型的训练详细信息" 部分 paper 。
Vicuna 在标准基准、人类偏好和 LL-as-a-judge 方面进行评估。有关更多详细信息,请参阅 paper 和 leaderboard 。
请参阅 vicuna_weights_version.md 。
特别感谢 @TheBloke 提前托管这个合并的权重版本。