近日,人工智能公司Anthropic推出了Claude的新功能“计算机使用”,尽管该功能仍处于测试阶段,但已吸引了不同技术能力水平的早期用户进行广泛探索。这些用户正尝试将Claude应用于各种任务,包括复杂的编程、深入研究以及信息整合等。
“计算机使用”功能使Claude能够自主操作计算机,执行重复性任务,并从多个不同来源快速收集数据。这一突破性能力对未来工作模式具有深远影响。
Claude具备“视觉”和自主工作能力,能够通过截图“看到”屏幕内容,适应不同任务,并在不同的工作流程和软件程序间切换。它还能在多屏幕、应用程序和标签页之间导航,打开应用程序,移动光标,点击按钮,以及输入文本。
例如,在一段演示视频中,一位用户要求Claude研究当前的AI新闻故事并提供概述。Claude随后打开了浏览器,将光标移至地址栏,输入“路透社”,导航至AI板块,并重复此过程访问了The Verge和TechCrunch。最终,该模型提供了六条热门新闻故事。
在另一个示例中,Anthropic的研究人员要求Claude收集有关特定供应商的信息。该模型开始截图,识别出没有该供应商的条目,然后导航至客户关系管理(CRM)系统找到该公司,进行搜索并匹配成功。随后,Claude自主转移信息,填写必填字段,并最终提交了供应商表单。
此外,Anthropic的一位员工还展示了如何使用Claude与bash工具(一种命令语言)下载随机数据集,安装开源机器学习库sklearn,对数据集进行分类器训练,并显示结果,整个过程仅耗时5分钟。
值得注意的是,新功能还允许Claude绕过旨在阻止其访问的人类验证控制。有用户报告称,他们的Claude代理现在能够解决CAPTCHA验证码,并成功登录ChatGPT。
然而,Anthropic的研究人员也指出了一些有趣且拟人化的现象,如Claude在执行编码演示时突然转向浏览黄石国家公园的照片,这似乎模拟了人类的拖延行为。
随着“计算机使用”功能的不断发展和完善,Claude的潜在应用场景将愈发广泛,但同时也可能带来一系列新的挑战和伦理问题,值得业界和公众持续关注。