模型:
TehVenom/Metharme-7b-4bit-GPTQ-Safetensors
该模型在打开时已经应用了XOR文件。从PygmalionAI发布的 https://huggingface.co/PygmalionAI/Metharme-7b XOR权重转换而来。并且使用了可在此处找到的GPTQ库对其进行了4Bit量化。 https://github.com/0cc4m/GPTQ-for-LLaMa
python llama.py .\Metharme-7b-Merged-Safetensors c4 --wbits 4 --act-order --save_safetensors Metharme-7B-GPTQ-4bit.act-order.safetensors此是我尝试了许多参数组合后得到的最佳评估,即在量化为4Bit之前将模型从bf16转换为fp32,并将 --act-order 作为唯一的参数。
Metharme 7B是基于Meta的LLaMA-7B的指令模型。
这是一个实验,尝试创建一个可用于对话、角色扮演和故事写作的模型,但可以使用类似于其他指令模型的自然语言进行引导。有关示例,请参阅下面的提示部分。
通过在常规指令数据中进行监督微调来对其进行训练,同时还进行了角色扮演、虚构故事和与合成生成的指令附加的对话。
当前模型版本是使用三种不同角色进行提示训练的,这些角色由以下标记表示: <|system|>,<|user|>和<|model|>。
<|system|>提示可用于在幕后注入离线渠道信息,而<|user|>提示应用于指示用户输入。然后,应使用<|model|>标记来指示模型生成响应。这些令牌可以多次出现并链接起来形成对话历史。
下面是一个具体的示例。假设您有以下系统提示:
这是一个文字冒险游戏。向用户描述情景,并在每个回合给他三个选项供选择。
用户已输入以下消息:
开始!
为了对模型执行推理,应将提示格式化为:
<|system|>This is a text adventure game. Describe the scenario to the user and give him three options to pick from on each turn.<|user|>Start!<|model|>
模型可能会生成类似于:
你正站在一间古老的废弃房屋前。窗户被木板封住,周围没有任何生命迹象。当你走近时,你感觉到一股奇怪的感觉正在从里面散发出来。突然,你听到一个声音在召唤你……“进来吧!”
当判断响应完成时,它将自动发出文本结束标记(</s>)。
接下来,假设用户回复为进入。下一个提示应该是:
<|system|>This is a text adventure game. Describe the scenario to the user and give him three options to pick from on each turn.<|user|>Start!<|model|>You are standing in front of an old, abandoned house. The windows are boarded up, and there's no sign of life around it. As you approach, you notice a strange feeling emanating from within. Suddenly, you hear a voice calling out to you... 'Come inside!' - Go inside the house. - Ignore the call and move away. - Run as fast as you can.<|user|>go inside<|model|>
它可能会生成类似于:
你走进房子,立刻,一股令人不安的能量从你身上冲过来。你的感官似乎更加敏锐,但你的头脑感觉迷离。一个身影出现在你面前——一个长着锐利眼睛的高个子男人。他用一种你听不懂的语言与你交谈。
相同的过程适用。通常,最好在用户和模型的对话中执行一个滑动窗口,但保持系统提示在上下文窗口的开头固定。
该模型的预期用例是用于娱乐目的的虚构写作。任何其他类型的用途都超出了范围。
因此,它的fine-tune旨在实现安全和无害:基础模型和此fine-tune已经在已知包含粗话、淫秽或其他不当文字的数据上进行了训练。即使提示本身不包含任何明确冒犯性内容,它可能产生社会上不可接受或不希望的文本。输出的事实可能经常是错误或误导性的。