AI初创公司Anthropic推出了最新的对话模型Claude 2.1,宣称其具有提升企业应用的新功能。该版本将Claude的上下文长度限制提高到了200,000个标记,并将错误陈述率降低了50%。
Claude 2.1的一些重点亮点包括:
Claude 2.1代表了Anthropic在平衡尖端AI能力与安全准确性方面的持续努力。更新的模型现在可以处理长达150,000个字的文档。这相当于超过500页的材料,如技术文档、财务报表,甚至文学作品。
公司在一篇博文中解释道:“我们的用户现在可以上传整个代码库、S-1文件,甚至像《伊利亚特》或《奥德赛》这样的长篇文学作品。通过能够处理大量内容或数据,Claude可以进行摘要、问答、预测趋势、比较和对比多个文档等等。”
处理200,000个标记是行业首次的复杂任务,Claude可能只需要几分钟的时间,而不是几个小时的人力工作。Anthropic预计,随着技术的成熟,延迟时间将大幅改善。
测试表明,与前一版本的Claude 2.0相比,Claude 2.1的错觉或错误主张率下降了一半。公司策划了一些关于事实的问题,针对AI模型经常出错的领域进行测试,结果显示Claude 2.1更高频率地承认不确定性,而不是提供错误信息。
更新的模型还展示了有意义的理解和总结能力的提升,特别是对于合同、财务报告和技术规范等需要高准确性的长篇复杂文档。Anthropic记录到错误答案减少了30%,Claude2.1错误地得出一个文件支持某种主张的情况减少了3-4倍。
改进的开发者体验和新的系统提示
Anthropic为Claude 2.1的API简化了开发者体验。新的工作台产品允许在类似游乐场的环境中进行快速迭代,同时具有新的模型设置以优化行为。此外,系统提示的引入使用户能够设置具体指示,让Claude扮演特定的个性或角色,并提供根据用户需求定制的回答。
引入API工具使用
Claude 2.1还引入了一个测试版的工具使用功能,可以与现有系统和数据源集成。早期采用者可以利用Claude的语言能力构建应用程序,将自然语言请求解析为API调用、搜索私有数据库或通过软件执行简单操作。示例用例包括:
更新的模型现已通过Anthropic的API提供,并驱动claude.ai网站。免费用户可以访问核心功能,而付费用户则可以解锁完整的200,000个标记的上下文窗口,进行大型文档分析。