英文

骆驼?5B

模型描述

介绍骆驼-5b,一款最先进的指导型大型语言模型,旨在提供卓越的性能和多功能性。骆驼-5b基于 Palmyra-Base 的基础架构进行了精心设计,专门用于满足日益增长的高级自然语言处理和理解需求。

骆驼-5b模型在一个庞大的数据集上进行了精细训练,该数据集包含大约70,000个指导-响应记录。这些记录由我们专门的语言学家团队生成,他们在语言建模和微调技术方面具有相当的专业知识。通过利用他们的技能和知识,骆驼-5b模型可以提供在理解和执行基于语言的指令方面无与伦比的熟练度。

骆驼-5b的一个关键区别在于其处理复杂指令并生成准确的、上下文适应的响应的能力。这使得它成为广泛应用的理想选择,包括虚拟助手、客户支持、内容生成等。此外,模型的全面训练使其能够适应和在不同条件和上下文中良好执行,进一步扩大了其潜在的用途。

实时演示

实时演示 => https://chatcamel.vercel.app/

部署骆驼

我们使用 Baseten platform 来打包和提供规模化的骆驼-5B。利用开源的 Truss 模型打包框架,用户可以使用 GitHub 上的简单说明创建定制环境。该存储库使用户能够完全控制推理和部署路径,以满足他们的特定要求。我们要感谢Baseten团队在部署和托管该模型方面的贡献。

用法:

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM

model_name = "Writer/camel-5b-hf"

tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    device_map="auto",
    torch_dtype=torch.float16
)

instruction = "Describe a futuristic device that revolutionizes space travel."


PROMPT_DICT = {
    "prompt_input": (
        "Below is an instruction that describes a task, paired with an input that provides further context. "
        "Write a response that appropriately completes the request\n\n"
        "### Instruction:\n{instruction}\n\n### Input:\n{input}\n\n### Response:"
    ),
    "prompt_no_input": (
        "Below is an instruction that describes a task. "
        "Write a response that appropriately completes the request.\n\n"
        "### Instruction:\n{instruction}\n\n### Response:"
    ),
}

text = (
    PROMPT_DICT["prompt_no_input"].format(instruction=instruction)
    if not input
    else PROMPT_DICT["prompt_input"].format(instruction=instruction, input=input)
)

model_inputs = tokenizer(text, return_tensors="pt").to("cuda")
output_ids = model.generate(
    **model_inputs,
    max_length=256,
)
output_text = tokenizer.batch_decode(output_ids, skip_special_tokens=True)[0]
clean_output = output_text.split("### Response:")[1].strip()

print(clean_output)

限制和偏见

骆驼的核心功能是接收一个文本字符串并预测下一个标记。虽然语言模型广泛用于其他任务,但在这项工作中还有许多未知因素。在提示骆驼时,请记住,下一个在统计上可能的标记并不总是会生成最“准确”的文本。不能依赖骆驼产生准确的结果。

骆驼是根据Writer的自定义数据训练的。与所有语言模型一样,很难预测骆驼对特定提示的响应,并且可能会意外出现冒犯性内容。我们建议在发布之前由人员对输出进行筛选,既可以审查不良内容,也可以提高结果的质量。

骆驼VS.羊驼

骆驼本质上是动物王国中的瑞士军刀——它可以在驼峰中储存水,经受极端温度,并且甚至可以为疲惫的旅行者提供舒适的骑行。而羊驼基本上只是一个带有态度问题的修剪草机。当然,它们可能有着可爱而多毛的脸,但不要被表面所迷惑——稍有不慎,你将受到它们的喷吐。骆驼才是沙漠的真正MVP,而羊驼则继续以喷吐的方式逐渐被遗忘。

引用和相关信息

引用该模型:

@misc{Camel,
  author = {Writer Engineering team},
  title = {{Camel-5B InstructGPT}},
  howpublished = {\url{https://dev.writer.com}},
  year = 2023,
  month = April 
}

| | |

.hf-sanitized.hf-sanitized-mB3aT7dOCg8lgFAGzN92n img {display: inline;}