Ai2发布OLMo 2：全面开源的语言模型新版本 | ATYUN.COM 官网-人工智能教程资讯全方位服务平台

登录注册

资讯

学习

基础知识理论实践学习教程

企业招聘

下载

模型数据集

AI工具箱

企业服务

EVA 智能HR 视频AI

ChatGPT 人工智能应用人工智能未来计算机视觉

热门新闻

行业人工智能

为什么数据污染对LLM来说是一个大问题

机器人康奈尔大学

康奈尔大学推出新的社交机器人，更柔软，更人性化

行业人工智能

所以，能动手就别吵吵了

常用工具

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub AI编程工具

Adobe最新推出的AI图片生成工具

AI艺术和创意辅助平台

您尚未登录账户

请先登录您的atyun账户，方可使用该功能

仅限企业账户使用

该功能仅限企业账号使用，开通企业账号可享受更多服务，是否现在注册企业账号？

立即注册企业账号

暂不需要

您的企业账号申请正在审核中

审核通过后即可使用此功能，请耐心等待~

Ai2发布OLMo 2：全面开源的语言模型新版本

2024年11月28日由 daydream 发表 363 0

近日，AI研究机构Ai2推出了其开源语言模型系列中的最新成员——OLMo 2。与LLama、Gemma等流行的开源权重模型不同，OLMo（全称Open Language Model）不仅提供模型权重，还包含了开发工具、数据集、训练指南等全套资源，实现了全方位的开源。

微信截图_20241128101227

OLMo 2系列包括70亿参数（基础版、指令版）和130亿参数（基础版、指令版）两个版本，均展现出强大性能。其中，70亿参数版本在英语学术基准测试中表现优于Meta的LLama 3.1 80亿参数版本；而130亿参数版本则在训练时使用了更少的计算资源，却超越了Qwen 2.5 70亿参数版本。

微信截图_20241128101236

此次发布是在今年早些时候推出的首款OLMo模型的基础上进行的。Ai2团队采用了一种创新的双阶段训练策略：首先在大规模数据集（包含3.9万亿个标记）上进行初步训练，随后使用高质量的学术内容、数学练习册和指令集数据进行精细化训练。

为确保训练稳定性，团队进行了关键性调整，以防止长时间训练过程中出现性能下降。这些调整涉及模型架构和训练流程的改进。

此外，OLMo 2的发布还建立在Ai2近期开发的开源训练系统Tülu 3的基础上。Tülu 3作为一个先进的后训练处理过程，使OLMo 2能够执行与世界顶级模型相媲美的指令遵循任务。

本次发布的完整内容包括评估框架和中间检查点，这些工具将帮助研究人员深入了解OLMo 2的性能，并在此基础上进行改进。

研究人员和开发者可通过Ai2的在线平台访问OLMo 2，或从Hugging Face平台下载。该模型采用Apache 2.0许可证，允许任何人无限制地学习、修改或在其基础上进行开发。

文章来源：https://www.maginative.com/article/ai2-releases-olmo-2-the-most-capable-fully-open-ai-model/

标签：

Ai2 语言模型

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 Hugging Face发布SmolVLM：轻量级视觉语言模型，推动AI普及化

下一篇昆仑万维发布“天工大模型4.0”o1版，自带中文逻辑推理

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来

每个人都应该知道的48个AI术语

openwebtext glue shunk031/JGLUE piqa wikitext sciq EleutherAI/lambada_openai facebook/flores

AI热点

行业学习机器学习人工智能公司板人工智能未来机器人视觉识别

AI工具

更多工具 »

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub AI编程工具

Adobe最新推出的AI图片生成工具

AI艺术和创意辅助平台

热门企业

更多企业 »

热门职位

更多职位 »

深度学习软件工程师

Maluuba

20000~40000/月

Unity技术经理

Cisco

25000~30000/月深圳市

高级数据分析工程师

PilotAILabs

30000~60000/年深圳市

广告

写评论取消

回复取消