微软推出更高的效率和成本效益的1-Bit LLM | ATYUN.COM 官网-人工智能教程资讯全方位服务平台

登录注册

资讯

学习

基础知识理论实践学习教程

企业招聘

下载

模型数据集

AI工具箱

企业服务

EVA 智能HR 视频AI

ChatGPT 人工智能应用人工智能未来计算机视觉

热门新闻

行业人工智能

为什么数据污染对LLM来说是一个大问题

机器人康奈尔大学

康奈尔大学推出新的社交机器人，更柔软，更人性化

行业人工智能

所以，能动手就别吵吵了

常用工具

OpenAI旗下AI对话工具

AI图像和插画生成工具，测试测试测试测试测试测测试

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub AI编程工具

百度推出的基于文心大模型的AI对话互动工具

讯飞星火认知大模型

科大讯飞推出的类ChatGPT的讯飞星火认知大模型

阿里旗下推出的AI搜索助手

您尚未登录账户

请先登录您的atyun账户，方可使用该功能

仅限企业账户使用

该功能仅限企业账号使用，开通企业账号可享受更多服务，是否现在注册企业账号？

立即注册企业账号

暂不需要

您的企业账号申请正在审核中

审核通过后即可使用此功能，请耐心等待~

微软推出更高的效率和成本效益的1-Bit LLM

2024年02月29日由 samoyed 发表 299 0

微软引入了一种新型的语言模型，称为1-Bit LLM（Large Language Model），最近的BitNet等研究为此项目做出了贡献。

Microsoft-agi-1300x731

这种创新的核心在于模型中每个参数的表示，通常称为权重，仅使用1.58位。与通常使用16位浮点值（FP16）作为权重的传统LLM不同，BitNet b1.58将每个权重限制为三个值之一：-1、0或1。这种位使用的实质性减少是所提出模型的基石。

他们发现，尽管BitNet b1.58每个参数只使用1.58位，但在模型大小和训练数据相同的情况下，该模型在困惑度和最终任务性能方面都与传统模型相当。重要的是，它在延迟、内存使用、吞吐量和能源消耗等方面更具成本效益。

这种1.58位LLM引入了一种新的语言模型扩展和训练方法，在高性能和成本效益之间实现了平衡。此外，它还为新的计算方式打开了可能性，并暗示了为这些1-BitLLM设计专用硬件优化的潜力。

该论文还涉及BitNet b1.58促进LLM中长序列的本机支持的可能性。作者建议未来的工作进一步探索无损压缩的可能性，从而可能实现更高的效率。

文章来源：https://analyticsindiamag.com/microsoft-introduces-1-bit-llm/

标签：

微软

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 Meta 或在今年秋季展示其首款AR眼镜

下一篇百度文心大模型推理成本骤降至1%，与众多企业达成合作

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

每个人都应该知道的48个AI术语

OpenAI重启人形机器人开发计划

openwebtext glue shunk031/JGLUE piqa wikitext sciq EleutherAI/lambada_openai facebook/flores

AI热点

行业学习机器学习人工智能公司板人工智能未来机器人视觉识别

AI工具

更多工具 »

OpenAI旗下AI对话工具

AI图像和插画生成工具，测试测试测试测试测试测测试

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub AI编程工具

百度推出的基于文心大模型的AI对话互动工具

广告

本周热门

更多资讯 »

热门企业

更多企业 »

热门职位

更多职位 »

深度学习软件工程师

Maluuba

20000~40000/月

Unity技术经理

Cisco

25000~30000/月深圳市

高级数据分析工程师

PilotAILabs

30000~60000/年深圳市

广告

写评论取消

回复取消