Metharme 7B

一个以虚构写作和对话为偏好的指令调整型LLaMA模型。

模型详情：

该模型在打开时已经应用了XOR文件。从PygmalionAI发布的 https://huggingface.co/PygmalionAI/Metharme-7b XOR权重转换而来。并且使用了可在此处找到的GPTQ库对其进行了4Bit量化。 https://github.com/0cc4m/GPTQ-for-LLaMa

python llama.py .\Metharme-7b-Merged-Safetensors c4 --wbits 4 --act-order --save_safetensors Metharme-7B-GPTQ-4bit.act-order.safetensors

此是我尝试了许多参数组合后得到的最佳评估，即在量化为4Bit之前将模型从bf16转换为fp32，并将 --act-order 作为唯一的参数。

Wikitext 2: 6.2369050979614
PTB-New: 47.5177230834960
C4-New: 7.9044938087463

Metharme 7B是基于Meta的LLaMA-7B的指令模型。

这是一个实验，尝试创建一个可用于对话、角色扮演和故事写作的模型，但可以使用类似于其他指令模型的自然语言进行引导。有关示例，请参阅下面的提示部分。

通过在常规指令数据中进行监督微调来对其进行训练，同时还进行了角色扮演、虚构故事和与合成生成的指令附加的对话。

提示

当前模型版本是使用三种不同角色进行提示训练的，这些角色由以下标记表示： <|system|>，<|user|>和<|model|>。

提示示例

下面是一个具体的示例。假设您有以下系统提示：

这是一个文字冒险游戏。向用户描述情景，并在每个回合给他三个选项供选择。

用户已输入以下消息：

开始！

为了对模型执行推理，应将提示格式化为：

<|system|>This is a text adventure game. Describe the scenario to the user and give him three options to pick from on each turn.<|user|>Start!<|model|>

模型可能会生成类似于：

你正站在一间古老的废弃房屋前。窗户被木板封住，周围没有任何生命迹象。当你走近时，你感觉到一股奇怪的感觉正在从里面散发出来。突然，你听到一个声音在召唤你……“进来吧！”

进入房子。
忽略呼叫，走开。
尽快逃跑。

当判断响应完成时，它将自动发出文本结束标记（</s>）。

接下来，假设用户回复为进入。下一个提示应该是：

<|system|>This is a text adventure game. Describe the scenario to the user and give him three options to pick from on each turn.<|user|>Start!<|model|>You are standing in front of an old, abandoned house. The windows are boarded up, and there's no sign of life around it. As you approach, you notice a strange feeling emanating from within. Suddenly, you hear a voice calling out to you... 'Come inside!'

- Go inside the house.
- Ignore the call and move away.
- Run as fast as you can.<|user|>go inside<|model|>

它可能会生成类似于：

你走进房子，立刻，一股令人不安的能量从你身上冲过来。你的感官似乎更加敏锐，但你的头脑感觉迷离。一个身影出现在你面前——一个长着锐利眼睛的高个子男人。他用一种你听不懂的语言与你交谈。

问他想要什么。
攻击他。
逃跑。

相同的过程适用。通常，最好在用户和模型的对话中执行一个滑动窗口，但保持系统提示在上下文窗口的开头固定。

限制和偏差

该模型的预期用例是用于娱乐目的的虚构写作。任何其他类型的用途都超出了范围。

因此，它的fine-tune旨在实现安全和无害：基础模型和此fine-tune已经在已知包含粗话、淫秽或其他不当文字的数据上进行了训练。即使提示本身不包含任何明确冒犯性内容，它可能产生社会上不可接受或不希望的文本。输出的事实可能经常是错误或误导性的。

作者:

TeH_Venom

数据集大小:

4.01 GB