Anthropic推出更加强大的Claude 3.5 Sonnet模型

2024年06月21日 由 samoyed 发表 295 0

人工智能的军备竞赛仍在持续加速:Anthropic公司推出了其最新模型Claude 3.5 Sonnet,据称在广泛的任务上可以与OpenAI的GPT-4o或谷歌的Gemini相媲美,甚至更胜一筹。这款新模型已经向Claude用户开放,可以在网页和iOS上使用,Anthropic公司还将其提供给开发者使用。


claude-3.5-sonnet


Claude 3.5 Sonnet将成为Anthropic产品线中的中端模型——Anthropic用“Haiku”命名其最小的模型,用“Sonnet”命名主流中端选项,用“Opus”命名其最高端模型。但该公司表示,3.5 Sonnet的性能超过了3 Opus,其基准测试显示,它在这方面的表现差距相当大。这款新模型的速度似乎也是前一款的两倍,这可能是一个更大的亮点。


对人工智能模型基准测试的结果应该持怀疑态度;这样的测试有很多,很容易选择那些让你看起来不错的测试,而且模型和产品的变化如此之快,以至于似乎没有人能在很长时间内保持领先地位。话虽如此,Claude 3.5 Sonnet看起来确实很令人印象深刻:在九个总体基准测试中,它在七个测试中超过了GPT-4o、Gemini 1.5 Pro和Meta的Llama 3 400B,在五个视觉基准测试中,它在四个测试中超过了这些模型。同样,不要对此解读过多,但Anthropic似乎确实在这一领域建立了一个合法的竞争对手。


Claude_3_5_Sonnet_Eval_General


这实际上意味着什么呢?Anthropic公司表示,Claude 3.5 Sonnet将更擅长编写和翻译代码,处理多步骤工作流程,解读图表,以及从图像中转录文本。这款新改进的Claude还显然更擅长理解幽默,并以更人性化的方式写作。


除了新模型外,Anthropic还推出了一个新功能,称为Artifacts。通过Artifacts,您将能够查看和与您的Claude请求的结果进行交互:如果您要求模型为您设计某些东西,它现在可以显示它的外观,并允许您直接在应用程序中编辑它。如果Claude为您写一封电子邮件,您可以在Claude应用程序中编辑电子邮件,而无需将其复制到文本编辑器中。这是一个小功能,但很巧妙——这些AI工具需要不仅仅是简单的聊天机器人,而像Artifacts这样的功能只是让应用程序有更多功能可做。


Claude_3_5_artifacts


Artifacts实际上似乎是Claude长期愿景的一个信号。Anthropic公司一直表示,它主要关注企业(尽管它聘请了Instagram联合创始人Mike Krieger等消费者科技人才),并在宣布Claude 3.5 Sonnet的新闻稿中表示,它计划将Claude转变为一种工具,让公司“在安全的环境中集中他们的知识、文档和正在进行的工作于一个共享空间”。这听起来更像是Notion或Slack,而不是ChatGPT,Anthropic的模型是整个系统的核心。


然而,目前来说,模型是最大的新闻。这里的改进速度令人惊叹:Anthropic在3月推出了Claude 3 Opus,骄傲地表示它的性能与GPT-4和Gemini 1.0相当,随后OpenAI和谷歌发布了各自模型的更好版本。现在,Anthropic已经迈出了下一步,它的竞争对手肯定也不会太久就会跟进。

文章来源:https://www.theverge.com/2024/6/20/24181961/anthropic-claude-35-sonnet-model-ai-launch
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
写评论取消
回复取消