在庆祝成立50周年之际,微软宣布对其AI助手Copilot进行重大更新,新增多项功能以提升用户体验,使其功能更接近ChatGPT和Claude等竞争对手。此次更新中,Copilot整合了多种OpenAI模型,新增功能包括记忆功能、个性化设置、基于网页的操作、播客创建、摄像头和屏幕分析、深度研究等。
新增的记忆功能使Copilot能够记住用户的偏好、兴趣以及生日等详细信息,并利用这些信息提供定制化的回答和建议,甚至主动提供提示。用户可以选择希望Copilot记住的信息,或完全关闭此功能。
微软表示,这是持续推动Copilot个性化的一部分。尽管目前处于初步阶段,但未来用户将能够为Copilot设置个性化外观,甚至可以选择恢复经典的Clippy形象。微软AI首席执行官穆斯塔法·苏莱曼指出,Copilot不仅仅是AI,而是属于用户个人的助手,每个用户都将拥有独特的风格和属性组合。
除了个性化,Copilot的功能也得到了增强。新增的Actions功能使其能够通过网页浏览器执行任务,类似于OpenAI的Operator代理或亚马逊最近发布的Nova Act模型。微软建议,该功能可用于预订演出票、预订餐厅和购物,尤其是结合新的购物功能,Copilot可以研究产品并寻找折扣和促销信息。
Copilot Vision功能于2024年12月在网页工具中推出,现已扩展到Windows和移动应用程序。在Windows上,Copilot能够“看到”其他应用程序和文件中的屏幕内容,以回答问题或与文件和内容互动。在iOS和Android上,它可以讨论手机摄像头拍摄的任何内容或相机胶卷中的照片。
深度研究功能使Copilot能够分析大量文档或在线资源,以支持复杂项目。其研究能力已与Bing集成,可在搜索引擎中提供AI驱动的回答。与其他AI工具一样,Copilot现在还可以利用其研究成果生成播客风格的音频来解释主题,而新的Pages功能则允许它将不同文档中的笔记和研究整理到一个统一的画布中。
微软表示,许多新功能将从今天开始以“初始版本”形式推出,并在未来几周和几个月内不断改进,不同功能、平台和市场的可用性将有所差异。尽管这些功能并非首创,例如ChatGPT去年已添加记忆功能,Google Gemini具备视觉模式,所有AI公司都在致力于构建个性化AI代理,但微软此次一次性推出所有这些功能,表明其致力于保持与竞争对手的同步,并充分利用对OpenAI的投资。