模型:

togethercomputer/RedPajama-INCITE-7B-Base

任务:

文本生成

类库:

PyTorch Transformers

数据集:

togethercomputer/RedPajama-Data-1T 3Atogethercomputer/RedPajama-Data-1T

语言:

其他:

gpt_neox text-generation-inference

许可:

apache-2.0

模型介绍文件清单

英文

RedPajama-INCITE-7B-Base

RedPajama-INCITE-7B-Base 是由Together和开源AI社区的领导者共同开发的，包括Ontocord.ai、ETH DS3Lab、AAI CERC、蒙特利尔大学、MILA - 魁北克AI研究所、斯坦福大学基础模型研究中心（CRFM）、斯坦福大学Hazy研究小组和LAION。该模型的训练是在INCITE 2023项目的支持下进行的，该项目为可扩展的通用AI基础模型提供了3,072个V100 GPU。该项目由MILA、LAION和EleutherAI于2022年秋季获得，得到了奥克里奇领导计算设施（OLCF）和INCITE计划的支持。

基础模型: RedPajama-INCITE-7B-Base
用于指令的版本: RedPajama-INCITE-7B-Instruct
聊天版本: RedPajama-INCITE-7B-Chat

模型详情

开发者 : Together Computer.
模型类型 : 语言模型
语言 : 英语
许可证 : Apache 2.0
模型描述 : 一种拥有69亿参数的预训练语言模型。

快速开始

请注意，此模型需要 transformers 版本>= 4.25.1。

GPU推理

需要具有16GB内存的GPU。

import torch
import transformers
from transformers import AutoTokenizer, AutoModelForCausalLM

MIN_TRANSFORMERS_VERSION = '4.25.1'

# check transformers version
assert transformers.__version__ >= MIN_TRANSFORMERS_VERSION, f'Please upgrade transformers to version {MIN_TRANSFORMERS_VERSION} or higher.'

# init
tokenizer = AutoTokenizer.from_pretrained("togethercomputer/RedPajama-INCITE-7B-Base")
model = AutoModelForCausalLM.from_pretrained("togethercomputer/RedPajama-INCITE-7B-Base", torch_dtype=torch.float16)
model = model.to('cuda:0')
# infer
prompt = "Alan Turing is"
inputs = tokenizer(prompt, return_tensors='pt').to(model.device)
input_length = inputs.input_ids.shape[1]
outputs = model.generate(
    **inputs, max_new_tokens=128, do_sample=True, temperature=0.7, top_p=0.7, top_k=50, return_dict_in_generate=True
)
token = outputs.sequences[0, input_length:]
output_str = tokenizer.decode(token)
print(output_str)
"""
widely considered to be the father of modern computer science and artificial intelligence. He was a brilliant mathematician and cryptographer, who worked for the British government during World War II. He was instrumental in breaking the German Enigma code, and is credited with helping to shorten the war by two years...
"""

使用Int8进行GPU推理

需要具有12GB内存的GPU。

要在Int8模式下运行推理，请确保您已安装了accelerate和bitandbytes。您可以使用以下命令安装它们:

pip install accelerate
pip install bitsandbytes

然后你可以按照以下方式使用Int8运行推理:

import torch
import transformers
from transformers import AutoTokenizer, AutoModelForCausalLM

MIN_TRANSFORMERS_VERSION = '4.25.1'

# check transformers version
assert transformers.__version__ >= MIN_TRANSFORMERS_VERSION, f'Please upgrade transformers to version {MIN_TRANSFORMERS_VERSION} or higher.'

# init
tokenizer = AutoTokenizer.from_pretrained("togethercomputer/RedPajama-INCITE-7B-Base")
model = AutoModelForCausalLM.from_pretrained("togethercomputer/RedPajama-INCITE-7B-Base", device_map='auto', torch_dtype=torch.float16, load_in_8bit=True)

# infer
prompt = "Alan Turing is"
inputs = tokenizer(prompt, return_tensors='pt').to(model.device)
input_length = inputs.input_ids.shape[1]
outputs = model.generate(
    **inputs, max_new_tokens=128, do_sample=True, temperature=0.7, top_p=0.7, top_k=50, return_dict_in_generate=True
)
token = outputs.sequences[0, input_length:]
output_str = tokenizer.decode(token)
print(output_str)
"""
a very well-known name in the world of computer science. It is named after the mathematician Alan Turing. He is famous for his work on the Enigma machine, which was used by the Germans during World War II....
"""```

## CPU Inference

```python
import torch
import transformers
from transformers import AutoTokenizer, AutoModelForCausalLM

MIN_TRANSFORMERS_VERSION = '4.25.1'

# check transformers version
assert transformers.__version__ >= MIN_TRANSFORMERS_VERSION, f'Please upgrade transformers to version {MIN_TRANSFORMERS_VERSION} or higher.'

# init
tokenizer = AutoTokenizer.from_pretrained("togethercomputer/RedPajama-INCITE-7B-Base")
model = AutoModelForCausalLM.from_pretrained("togethercomputer/RedPajama-INCITE-7B-Base", torch_dtype=torch.bfloat16)
# infer
prompt = "Alan Turing is"
inputs = tokenizer(prompt, return_tensors='pt').to(model.device)
input_length = inputs.input_ids.shape[1]
outputs = model.generate(
    **inputs, max_new_tokens=128, do_sample=True, temperature=0.7, top_p=0.7, top_k=50, return_dict_in_generate=True
)
token = outputs.sequences[0, input_length:]
output_str = tokenizer.decode(token)
print(output_str)
"""
one of the most important figures in the history of computing. He is best known for his work on the development of the modern computer and for his code-breaking work during World War II. He was also a brilliant mathematician and philosopher.
"""

请注意，由于LayerNormKernelImpl在CPU上没有实现fp16，我们在CPU推理中使用bfloat16。

使用

直接使用

以下是不适合使用的情况。

不当使用、恶意使用和超出范围的使用

使用者有责任确保以负责任和道德的方式使用该模型。

超出范围的使用

RedPajama-INCITE-7B-Base 是一种语言模型，可能在其预定范围之外的其他用例中表现不佳。例如，它可能不适用于安全关键应用程序或对个人或社会产生重大影响的决策。重要的是要考虑模型的局限性，只在其预期目的下使用它。

不当使用和恶意使用

RedPajama-INCITE-7B-Base 是为语言建模而设计的。严禁滥用该模型，例如用于从事非法或不道德活动，这违反了该项目的原则。

为了避免滥用该模型，以下是禁止的用途：

生成虚假新闻、错误信息或宣传
推动仇恨言论、歧视或针对个人或团体的暴力行为
未经个人或组织同意冒充个人或组织
从事网络欺凌或骚扰行为
诽谤性内容
垃圾邮件或欺诈行为
未经适当授权分享机密或敏感信息
违反模型或用于训练其的数据的使用条款
创建用于恶意目的的自动化机器人，如传播恶意软件、网络钓鱼诈骗或垃圾邮件

限制

RedPajama-INCITE-7B-Base 和其他语言模型一样，存在一些限制需要考虑。例如，该模型可能无法始终提供准确或相关的答案，特别是对于复杂、模糊或超出其训练数据范围的问题。因此，我们欢迎个人和组织的贡献，并鼓励合作，共同打造更强大、更包容的聊天机器人。

训练

训练数据

请参考 togethercomputer/RedPajama-Data-1T 。

训练过程

硬件: 512个6xV100节点（IBM Power9），在OLCF Summit集群上
优化器: Apex FusedAdam
并行计算方式: 分管道并行计算12，张量并行计算2
梯度积累 : 8（全局批量大小为4M标记）
标记数量: 1.001万亿标记
学习率: 0.00012

基准测试

请参考我们的 blog post 以获取基准测试结果。

中间检查点

我们提供了11个已发布供研究使用的中间检查点。这些检查点基于它们所包含的标记数量进行组织，范围从2400亿标记到1万亿标记。

社区

加入我们在 Together Discord 上。

作者:

Together

数据集大小:

12.9 GB