Anthropic推出Claude 2.1版本模型，支持200K上下文并减少幻觉

2023年11月22日由 daydream 发表 861 0

AI初创公司Anthropic推出了最新的对话模型Claude 2.1，宣称其具有提升企业应用的新功能。该版本将Claude的上下文长度限制提高到了200,000个标记，并将错误陈述率降低了50%。

微信截图_20231122114656

Claude 2.1的一些重点亮点包括：

通过提高诚实度，减少错觉感，提高可靠性
扩展的上下文窗口，解锁了像长篇内容和RAG这样的新用例
早期访问工具使用和函数调用，提供更高的灵活性和扩展能力

Claude 2.1代表了Anthropic在平衡尖端AI能力与安全准确性方面的持续努力。更新的模型现在可以处理长达150,000个字的文档。这相当于超过500页的材料，如技术文档、财务报表，甚至文学作品。

公司在一篇博文中解释道：“我们的用户现在可以上传整个代码库、S-1文件，甚至像《伊利亚特》或《奥德赛》这样的长篇文学作品。通过能够处理大量内容或数据，Claude可以进行摘要、问答、预测趋势、比较和对比多个文档等等。”

处理200,000个标记是行业首次的复杂任务，Claude可能只需要几分钟的时间，而不是几个小时的人力工作。Anthropic预计，随着技术的成熟，延迟时间将大幅改善。

微信截图_20231122114716

测试表明，与前一版本的Claude 2.0相比，Claude 2.1的错觉或错误主张率下降了一半。公司策划了一些关于事实的问题，针对AI模型经常出错的领域进行测试，结果显示Claude 2.1更高频率地承认不确定性，而不是提供错误信息。

微信截图_20231122114727

更新的模型还展示了有意义的理解和总结能力的提升，特别是对于合同、财务报告和技术规范等需要高准确性的长篇复杂文档。Anthropic记录到错误答案减少了30%，Claude2.1错误地得出一个文件支持某种主张的情况减少了3-4倍。

改进的开发者体验和新的系统提示

微信截图_20231122114740

Anthropic为Claude 2.1的API简化了开发者体验。新的工作台产品允许在类似游乐场的环境中进行快速迭代，同时具有新的模型设置以优化行为。此外，系统提示的引入使用户能够设置具体指示，让Claude扮演特定的个性或角色，并提供根据用户需求定制的回答。

引入API工具使用

Claude 2.1还引入了一个测试版的工具使用功能，可以与现有系统和数据源集成。早期采用者可以利用Claude的语言能力构建应用程序，将自然语言请求解析为API调用、搜索私有数据库或通过软件执行简单操作。示例用例包括：

使用计算器进行复杂的数值推理
将请求转换为结构化的API调用
通过搜索数据库或使用Web搜索API回答问题
通过私有API在软件中执行简单操作
连接到产品数据集，进行推荐并帮助用户完成购买

更新的模型现已通过Anthropic的API提供，并驱动claude.ai网站。免费用户可以访问核心功能，而付费用户则可以解锁完整的200,000个标记的上下文窗口，进行大型文档分析。

文章来源：https://www.maginative.com/article/anthropic-unveils-claude-2-1-with-200k-context-capability-and-reduced-hallucination/

标签：

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇百川智能与鹏城实验室携手推进国产算力大模型创新与应用

下一篇 Inflection AI推出Inflection-2，性能超越Llama 2和PaLM 2

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来

每个人都应该知道的48个AI术语

openwebtext glue shunk031/JGLUE piqa wikitext sciq EleutherAI/lambada_openai facebook/flores

AI热点

行业学习机器学习人工智能公司板人工智能未来机器人视觉识别

AI工具

更多工具 »

火山写作

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub Copilot

GitHub AI编程工具

Adobe Firefly

Adobe最新推出的AI图片生成工具

文心一格

AI艺术和创意辅助平台

热门企业

更多企业 »

热门职位

更多职位 »

深度学习软件工程师

Maluuba

20000~40000/月

Unity技术经理

Cisco

25000~30000/月深圳市

高级数据分析工程师

PilotAILabs

30000~60000/年深圳市