微软AI首席执行官穆斯塔法·苏莱曼在Bluesky平台宣布,微软Copilot的Vision功能现已在Edge浏览器中免费开放使用。这一AI助手功能能够识别屏幕内容,并协助用户操作应用程序。
Vision功能采用“语音交互”模式,用户通过语音指令与Copilot互动,等待其响应。苏莱曼指出,用户启用该功能后,Copilot Vision可实时“观察”屏幕内容。例如,在烹饪时,用户可借助该功能逐步完成食谱操作;或让其“解析”职位描述,进而直接生成定制化的面试准备方案或简历构思。不过,微软支持页面提示,Copilot Vision虽可能通过高亮屏幕部分区域帮助用户定位信息,但不会自动点击链接或执行其他操作。
目前,更广泛的系统级Copilot Vision功能仍仅限Copilot Pro订阅用户。订阅用户可在Edge浏览器外使用该功能,例如协助操作Photoshop或视频编辑软件,或指导用户完成《我的世界》等游戏任务。
用户若想体验Copilot Vision,需在Edge浏览器中打开微软官网指定链接,系统将提示用户启用该功能。授权后,用户可在任意网站打开Copilot侧边栏,点击麦克风图标启动Vision会话,此时浏览器会发出提示音并改变色调。
实际使用中,部分用户反馈需多次尝试后Edge浏览器才会弹出启用提示,且启用后可能出现控制界面无法加载的情况。但鉴于不同设备性能差异,实际体验可能存在差异。
微软声明,公司仅记录Copilot的响应内容,不会在Vision会话期间收集用户输入、图像或页面内容。用户结束屏幕共享时,可直接终止会话或关闭浏览器窗口。