对于我们许多人来说,购买杂货是一项常见的活动,但对于视障人士来说,识别杂货物品可能是十分困难的。新加坡国立大学计算机学院(NUS Computing)的一组研究人员推出了AiSee,这是一种经济实惠的可穿戴辅助设备,可帮助视障人士在人工智能(AI)的帮助下“看到”周围的物体。
有视力障碍的人每天都面临障碍,特别是在物体识别方面,这对于简单和复杂的决策都至关重要。虽然人工智能的突破极大地提高了视觉识别能力,但这些先进技术的实际应用仍然具有挑战性且容易出错。
AiSee于2018年首次开发,并在五年内逐步升级,旨在通过利用最先进的人工智能技术来克服这些限制。
“通过AiSee,我们的目标是为用户提供更自然的互动。通过遵循以人为本的设计过程,我们找到了质疑使用带有摄像头的眼镜的典型方法的理由。有视力障碍的人可能不愿意戴眼镜以避免被污名化。因此,我们提出了一种包含隐蔽骨传导耳机的替代硬件,“来自新加坡国立大学计算机信息系统与分析系的AiSee项目副教授Suranga Nanayakkara的首席研究员说。
用户只需握住一个物体并激活内置摄像头即可捕获物体的图像。在AI的帮助下,AiSee将识别对象,并且在用户查询时也会提供更多信息。
AiSee由三个关键组件组成:
眼睛:视觉引擎计算机软件
AiSee集成了一个微型摄像头,可以捕捉用户的视野。这构成了AiSee的软件组件,也称为“视觉引擎计算机”。该软件能够从捕获的图像中提取文本、徽标和标签等特征进行处理。
大脑:人工智能驱动的图像处理单元和交互式问答系统
在用户拍摄感兴趣物体的照片后,AiSee利用复杂的基于云的AI算法来处理和分析捕获的图像以识别物体。用户还可以提出一系列问题,以了解有关对象的更多信息。
AiSee采用先进的文字转语音和语音转文字识别和处理技术来识别物体并理解用户的查询。在大型语言模型的支持下,AiSee在交互式问答交流方面表现出色,使系统能够以及时和信息丰富的方式准确理解和响应用户的查询。
与大多数需要智能手机配对的可穿戴辅助设备相比,AiSee作为一个独立的系统运行,可以独立运行,无需任何额外的设备。
喇叭:骨传导音响系统
AiSee的耳机采用骨传导技术,使声音能够通过颅骨进行传播。这确保了有视觉障碍的人可以有效地接收听觉信息,同时仍然可以访问外部声音,例如对话或交通噪音。这对视障人士尤为重要,因为环境声音为决策提供了重要信息,尤其是在涉及安全考虑的情况下。
“目前,新加坡的视障人士无法获得这种复杂程度的辅助人工智能技术。因此,我们相信AiSee有潜力使视障人士能够独立完成目前需要帮助的任务。我们的下一步是让大众负担得起和访问AiSee。为了实现这一目标,我们正在进行进一步的改进,包括更符合人体工程学的设计和更快的处理单元,“Nanayakkara副教授解释说。
新加坡国立大学学生Mark Myres作为视障用户帮助测试了AiSee,他评论说:“很多时候,辅助设备似乎非常针对完全盲人或视障人士。我认为AiSee是一个很好的平衡。视障人士和盲人都可以从中受益匪浅。