苹果加速人工智能发展：看看其新模型能做什么

2024年07月23日由 samoyed 发表 268 0

尽管苹果公司在进入人工智能领域之初有所延迟，但在苹果全球开发者大会之后，该公司已全力投入人工智能领域。苹果智能（Apple Intelligence）将为苹果几乎所有的产品提供人工智能解决方案，并且公司并未止步于此。相反，苹果现在正在进一步进军人工智能语言模型领域。

gettyimages-1300502150

上周四，苹果在Hugging Face上发布了DCLM-Baseline-7B，这是一个拥有70亿参数的语言模型。该模型是DataComp for Language Models（DCLM）基准测试的一部分，该计划旨在提高语言模型训练数据集的质量。

这款拥有70亿参数的模型与诸如Llama 2、Gemma等热门模型相当。在针对同等规模热门模型的Massive Multitask Language Understanding（MMLU）基准测试中，DCLM-Baseline-7B表现不俗，甚至超过了Mistral 7B，如下图所示。

尽管DCLM-Baseline-7B的表现令人印象深刻，但它最大的亮点之一是模型真正实现了开源，拥有“开放的数据、开放的权重模型、开放的训练代码”，苹果公司的研究科学家Vaishaal Shankar强调说。

“我们已经在Hugging Face上发布了我们的DCLM模型！据我们所知，这些是目前表现最好的真正开源模型（开放的数据、开放的权重模型、开放的训练代码）。”
——Vaishaal Shankar（@Vaishaal）2024年7月18日

许多人赞扬了苹果的这种做法，因为它允许其他研究人员和开发人员在这些模型的基础上进行构建，并进一步推动该领域的发展。该模型是在DCLM-BASELINE数据的基础上，结合StarCoder和ProofPile2数据进行训练的，以达到在编码和数学等其他任务上的熟练程度。

除了发布DCLM-Baseline-7B、模型权重、训练代码和数据集外，苹果还在该软件包中包括了一个拥有14亿参数的强大版本。

这并非苹果首次涉足AI模型领域，之前还发布了其他模型，如Ferret-UI，一个多模态大型语言模型（MLLM），以及Reference Resolution As Language Modeling（ReALM），一个对话式AI系统。今年秋季，当iOS 18和苹果智能（Apple Intelligence）上线后，我们将能看到苹果在AI领域的竞争，并更好地评估其AI努力的潜在成功。

文章来源：https://www.zdnet.com/article/apple-accelerates-ai-efforts-heres-what-its-new-models-can-do/

标签：

苹果

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇埃隆·马斯克宣布“世界上最强大的”AI训练集群

下一篇 Stability AI 开源音频生成模型——Stable Audio Open

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来