模型:

ckip-joint/bloom-3b-zh

任务:

文本生成

类库:

PyTorch Transformers

语言:

其他:

bloom text-generation-inference

预印本库:

arxiv:2303.04715

许可:

bigscience-bloom-rail-1.0

模型介绍文件清单

英文

BLOOM-zh

传统中文增强BLOOM语言模型

模型卡片

Version 1.0 / 2023年4月10日

BLOOM-zh是中央研究院中文信息处理研究小组（ link ）、联发科技研究院（連結 , 连结 , link ）和国家教育研究院（ link ）之间的联合合作。该模型仅用于非商业研究目的。

模型详情

BLOOM-zh是具有增强传统中文能力的语言模型。它源于 BLOOMZ 。BLOOM-zh在大量的传统中文文本数据上进行了扩展训练。

基本信息

开发者：联发科技研究院
模型类型：基于Transformer的语言模型
版本：1.0.0
语言：多种语言，请参阅训练数据
许可证：联发科技研究院许可证（ link ）和RAIL许可证v1.0（ link ）
预计发布日期：2023年4月10日（星期一）
提问邮箱：info@mtkresearch.com
论文： https://arxiv.org/abs/2303.04715
引用：联发科技研究院：传统中文增强BLOOM语言模型。国际，2023年2月。
贡献者机构：
- 联发科技研究院
- 中央研究院
- 国家教育研究院

技术规格

此部分提供给从事模型开发的人员的信息。

有关技术规格，请参阅 BLOOM 。

环境影响

有关环境影响，请参阅 BLOOM 。

用途

此部分回答了模型的预期使用方式，讨论了可能受到模型影响的用户，并描述了被认为超出范围或滥用模型的用途。它为准备使用该模型或受该模型影响的任何人提供信息。

有关模型的用途，请参阅 BLOOM 。

训练数据

此部分提供了对训练数据的高级概述。对于想要了解模型学习内容基本知识的任何人都是相关的。

我们使用总计130亿个标记的高质量传统中文文本对3B参数模型进行了训练。详细信息请参阅 paper 。

风险和限制

此部分确定了可预见的危害和误解。

有关风险和限制，请参阅 BLOOM 。

因素

此部分列出了BLOOM模型的一些不同方面，重点是那些可能导致模型行为高度变异的方面。

该模型是在传统中文上进行训练的。然而，预训练的权重涵盖了40多种不同的语言。
该模型是在网络爬取数据、新闻文章、小说、知识来源（百科全书、教育领域）和说明书上进行训练的。

建议

此部分提供有关警告和潜在缓解措施的信息。

有关建议，请参阅 BLOOM 。

模型卡片作者

按照耗费时间和时间顺序排序。

Philipp Ennen、Po-Chun Hsu、Chan-Jan Hsu、Chang-Le Liu、Yen-Chen Wu、Yin-Hsiang Liao、Chin-Tung Lin、Chi-Ming Chung、Yi-Chang Chen、Da-Shan Shiu、Wei-Yun Ma

作者:

CKIP Joint Research Group

数据集大小:

11.2 GB