Anthropic推出更加强大的Claude 3.5 Sonnet模型

2024年06月21日由 samoyed 发表 374 0

人工智能的军备竞赛仍在持续加速：Anthropic公司推出了其最新模型Claude 3.5 Sonnet，据称在广泛的任务上可以与OpenAI的GPT-4o或谷歌的Gemini相媲美，甚至更胜一筹。这款新模型已经向Claude用户开放，可以在网页和iOS上使用，Anthropic公司还将其提供给开发者使用。

claude-3.5-sonnet

Claude 3.5 Sonnet将成为Anthropic产品线中的中端模型——Anthropic用“Haiku”命名其最小的模型，用“Sonnet”命名主流中端选项，用“Opus”命名其最高端模型。但该公司表示，3.5 Sonnet的性能超过了3 Opus，其基准测试显示，它在这方面的表现差距相当大。这款新模型的速度似乎也是前一款的两倍，这可能是一个更大的亮点。

对人工智能模型基准测试的结果应该持怀疑态度；这样的测试有很多，很容易选择那些让你看起来不错的测试，而且模型和产品的变化如此之快，以至于似乎没有人能在很长时间内保持领先地位。话虽如此，Claude 3.5 Sonnet看起来确实很令人印象深刻：在九个总体基准测试中，它在七个测试中超过了GPT-4o、Gemini 1.5 Pro和Meta的Llama 3 400B，在五个视觉基准测试中，它在四个测试中超过了这些模型。同样，不要对此解读过多，但Anthropic似乎确实在这一领域建立了一个合法的竞争对手。

Claude_3_5_Sonnet_Eval_General

这实际上意味着什么呢？Anthropic公司表示，Claude 3.5 Sonnet将更擅长编写和翻译代码，处理多步骤工作流程，解读图表，以及从图像中转录文本。这款新改进的Claude还显然更擅长理解幽默，并以更人性化的方式写作。

除了新模型外，Anthropic还推出了一个新功能，称为Artifacts。通过Artifacts，您将能够查看和与您的Claude请求的结果进行交互：如果您要求模型为您设计某些东西，它现在可以显示它的外观，并允许您直接在应用程序中编辑它。如果Claude为您写一封电子邮件，您可以在Claude应用程序中编辑电子邮件，而无需将其复制到文本编辑器中。这是一个小功能，但很巧妙——这些AI工具需要不仅仅是简单的聊天机器人，而像Artifacts这样的功能只是让应用程序有更多功能可做。

Claude_3_5_artifacts

Artifacts实际上似乎是Claude长期愿景的一个信号。Anthropic公司一直表示，它主要关注企业（尽管它聘请了Instagram联合创始人Mike Krieger等消费者科技人才），并在宣布Claude 3.5 Sonnet的新闻稿中表示，它计划将Claude转变为一种工具，让公司“在安全的环境中集中他们的知识、文档和正在进行的工作于一个共享空间”。这听起来更像是Notion或Slack，而不是ChatGPT，Anthropic的模型是整个系统的核心。

然而，目前来说，模型是最大的新闻。这里的改进速度令人惊叹：Anthropic在3月推出了Claude 3 Opus，骄傲地表示它的性能与GPT-4和Gemini 1.0相当，随后OpenAI和谷歌发布了各自模型的更好版本。现在，Anthropic已经迈出了下一步，它的竞争对手肯定也不会太久就会跟进。

文章来源：https://www.theverge.com/2024/6/20/24181961/anthropic-claude-35-sonnet-model-ai-launch

标签：

Anthropic

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 Snapchat将推出设备端AI模型实现实时环境变化

下一篇超越GPT-4 Turbo，科大讯飞发布全新讯飞星火V4.0大模型

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来