模型:

TheBloke/WizardLM-30B-GPTQ

任务:

文本生成

类库:

Transformers

其他:

llama text-generation-inference

许可:

other

模型介绍文件清单

英文

Chat & support: my new Discord server

Want to contribute? TheBloke's Patreon page

WizardLM的WizardLM 30B v1.0 GPTQ

这些文件是用于 WizardLM's WizardLM 30B v1.0 的GPTQ 4位模型文件。

这是使用 GPTQ-for-LLaMa 进行4位量化的结果。

其他可用的存储库

提示模板

A chat between a curious user and an artificial intelligence assistant.
The assistant gives helpful, detailed, and polite answers to the user's questions.
USER: prompt goes here
ASSISTANT:

如何轻松下载和使用此模型在文本生成WebUI中

下载模型

点击 Model 选项卡。

在下载自定义模型或LoRA 下方，输入 TheBloke/WizardLM-30B-GPTQ 。

点击下载。

等待直到显示下载完成。

取消选中“自动加载模型”。

点击左上角 Model 旁边的刷新图标。

使用AutoGPTQ（如果安装了）

在 Model 下拉菜单中: 选择刚下载的模型 WizardLM-30B-GPTQ 。

在 GPTQ 部分，勾选 AutoGPTQ 。

在右上方点击保存此模型的设置。

点击右上方的重新加载模型。

一旦显示已加载，点击文本生成选项卡并输入提示！

使用GPTQ-for-LLaMa

在 Model 下拉菜单中: 选择刚下载的模型 WizardLM-30B-GPTQ 。

如果在右下方看到错误，请忽略它 - 这是临时的。

在右侧填写 GPTQ 参数: Bits = 4, Groupsize = -1, model_type = Llama

在右上方点击保存此模型的设置。

点击右上方的重新加载模型。

一旦显示已加载，点击文本生成选项卡并输入提示！

提供的文件

wizardlm-30b-GPTQ-4bit--1g.act.order.safetensors

这将适用于GPTQ-for-LLaMa的所有版本，以及AutoGPTQ。

它使用无组大小创建，以降低VRAM要求，并使用--act-order（desc_act）尽可能提高推理准确性。

wizardlm-30b-GPTQ-4bit--1g.act.order.safetensors
- 适用于GPTQ-for-LLaMa的所有版本代码，包括Triton和CUDA分支
- 适用于AutoGPTQ
- 适用于一键安装的text-generation-webui
- 参数: Groupsize = -1。Act Order / desc_act = True。

Discord

如需进一步支持，并对这些模型和AI进行讨论，请加入我们：

TheBloke AI's Discord server

感谢以及如何贡献

感谢 chirper.ai 团队！

我已经有很多人问我是否可以做出贡献。我喜欢提供模型和帮助人们，也希望能够在此基础上投入更多时间，同时扩大到新的项目，如精细调整/训练。

如果您能够并愿意做出贡献，我将非常感激，并且这将帮助我继续提供更多模型，并开始进行新的AI项目。

捐赠者将优先获得对所有AI/LLM/模型问题和请求的支持，以及进入私人Discord房间和其他福利的机会。

Patreon: https://patreon.com/TheBlokeAI
Ko-Fi: https://ko-fi.com/TheBlokeAI

特别感谢: CarbonQuill的Luke、Aemon Algiz、Dmitriy Samsonov。

Patreon特别提到: Ajan Kanaga、Kalila、Derek Yates、Sean Connelly、Luke、Nathan LeClaire、Trenton Dambrowitz、Mano Prime、David Flickinger、vamX、Nikolai Manek、senxiiz、Khalefa Al-Ahmad、Illia Dulskyi、trip7s trip、Jonathan Leane、Talal Aujan、Artur Olbinski、Cory Kujawski、Joseph William Delisle、Pyrater、Oscar Rangel、Lone Striker、Luke Pendergrass、Eugene Pentland、Johann-Peter Hartmann。

感谢所有慷慨的赞助者和捐赠者！

原始模型卡片: WizardLM的WizardLM 30B v1.0

这是WizardLM-30B V1.0增量权重。

项目仓库: https://github.com/nlpxucan/WizardLM

注意: WizardLM-30B-V1.0 与 WizardLM-13B-V1.0 在对话开始时使用不同的提示 Wizard-7B-V1.0:

对于 WizardLM-30B-V1.0 和 WizardLM-13B-V1.0 ，提示应为以下内容:

"一个好奇用户和人工智能助手之间的聊天。助手给出有帮助、详细和礼貌的回答。用户: 你好，你是谁？助手:"

对于 WizardLM-7B-V1.0 ，提示应为以下内容:

"{instruction}\n\n### 回复:"

作者:

Tom Jobbins

数据集大小:

15.78 GB