Anthropic推出Claude 2.1版本模型,支持200K上下文并减少幻觉

2023年11月22日 由 daydream 发表 480 0

AI初创公司Anthropic推出了最新的对话模型Claude 2.1,宣称其具有提升企业应用的新功能。该版本将Claude的上下文长度限制提高到了200,000个标记,并将错误陈述率降低了50%。


微信截图_20231122114656


Claude 2.1的一些重点亮点包括:

  • 通过提高诚实度,减少错觉感,提高可靠性
  • 扩展的上下文窗口,解锁了像长篇内容和RAG这样的新用例
  • 早期访问工具使用和函数调用,提供更高的灵活性和扩展能力


Claude 2.1代表了Anthropic在平衡尖端AI能力与安全准确性方面的持续努力。更新的模型现在可以处理长达150,000个字的文档。这相当于超过500页的材料,如技术文档、财务报表,甚至文学作品。


公司在一篇博文中解释道:“我们的用户现在可以上传整个代码库、S-1文件,甚至像《伊利亚特》或《奥德赛》这样的长篇文学作品。通过能够处理大量内容或数据,Claude可以进行摘要、问答、预测趋势、比较和对比多个文档等等。”


处理200,000个标记是行业首次的复杂任务,Claude可能只需要几分钟的时间,而不是几个小时的人力工作。Anthropic预计,随着技术的成熟,延迟时间将大幅改善。


微信截图_20231122114716


测试表明,与前一版本的Claude 2.0相比,Claude 2.1的错觉或错误主张率下降了一半。公司策划了一些关于事实的问题,针对AI模型经常出错的领域进行测试,结果显示Claude 2.1更高频率地承认不确定性,而不是提供错误信息。


微信截图_20231122114727


更新的模型还展示了有意义的理解和总结能力的提升,特别是对于合同、财务报告和技术规范等需要高准确性的长篇复杂文档。Anthropic记录到错误答案减少了30%,Claude2.1错误地得出一个文件支持某种主张的情况减少了3-4倍。


改进的开发者体验和新的系统提示


微信截图_20231122114740


Anthropic为Claude 2.1的API简化了开发者体验。新的工作台产品允许在类似游乐场的环境中进行快速迭代,同时具有新的模型设置以优化行为。此外,系统提示的引入使用户能够设置具体指示,让Claude扮演特定的个性或角色,并提供根据用户需求定制的回答。


引入API工具使用


Claude 2.1还引入了一个测试版的工具使用功能,可以与现有系统和数据源集成。早期采用者可以利用Claude的语言能力构建应用程序,将自然语言请求解析为API调用、搜索私有数据库或通过软件执行简单操作。示例用例包括:

  • 使用计算器进行复杂的数值推理
  • 将请求转换为结构化的API调用
  • 通过搜索数据库或使用Web搜索API回答问题
  • 通过私有API在软件中执行简单操作
  • 连接到产品数据集,进行推荐并帮助用户完成购买


更新的模型现已通过Anthropic的API提供,并驱动claude.ai网站。免费用户可以访问核心功能,而付费用户则可以解锁完整的200,000个标记的上下文窗口,进行大型文档分析。

文章来源:https://www.maginative.com/article/anthropic-unveils-claude-2-1-with-200k-context-capability-and-reduced-hallucination/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消