Be My Eyes是一款创新的移动应用,它可以将视力障碍的用户与有视力的志愿者连接起来,为他们提供视觉帮助。该应用现已推出,这是一款基于人工智能的图像识别工具,目前已经对数十万的iOS应用用户开放测试。
Be My AI利用OpenAI最近发布的多模态GPT-4V的先进的人工智能图像识别技术,为盲人用户拍摄的照片提供了详细的描述,以帮助他们完成日常任务和应对各种情况。这项功能已经开始在本周推出,并将在未来几周内逐步为现有的Be My Eyes iPhone应用用户开放。
盲人用户只需打开应用,点击Be My AI选项卡,拍摄一张照片,就可以收到实时的详细语音描述。用户还可以提出后续问题,以获得更多的信息。根据Be My Eyes的说法,在测试期间,常见的用途包括阅读包装、说明书和电器控制器,以及获取周围环境、艺术品和社交媒体图片的描述。它还通过在29种语言中生成书面回复,为失聪失明的用户提供了帮助。
Be My AI是一个让盲人社区更容易获取视觉信息的重大进步。但是,Be My Eyes强调,它并不是要取代像白手杖或导盲犬这样的关键的移动工具。该应用还会在需要时将用户连接到人类志愿者,以提供视觉帮助。
Be My AI已经开发了7个月,结合了来自超过1.9万名盲人测试者的反馈,以改善用户体验。虽然人工智能的准确性在不断提高,但Be My Eyes承认,早期阶段的人工智能仍然会有一些错误。他们鼓励用户提供反馈,以改进系统。
盲人社区的反馈对于这项创新的形成起了至关重要的作用。一位叫Sarah的用户,分享了她的经历:“Chat GPT看起来是一个遥远的工具,但当它集成到Be My Eyes时,我决定尝试一下。它在解读社交媒体平台上很少有描述的图片方面非常有价值。”
安卓版本也即将在未来几个月内开放测试。Be My Eyes拥有超过690万名志愿者,希望这个最新的功能能够进一步实现他们让世界更具可及性的目标。虽然人工智能有其局限性,但Be My AI代表了一个令人兴奋的新的无需手动操作的获取视觉信息的选项。
这为盲人和低视力用户在日常生活中提供了更大的独立性和便利性。作为Be My Eyes的第一个重大的人工智能集成,它很可能预示着更多以可访问性为重点的创新型人工智能应用程序即将到来。