当计算机视觉遇上物理和大数据
2023年06月15日 由 Samoyed 发表
486999
0
加州大学洛杉矶分校和美国陆军研究实验室的研究人员提出了一种新方法,通过在数据驱动技术中添加基于物理学的认知来增强人工智能驱动的计算机视觉技术。
该研究发表在Nature Machine Intelligence杂志上,其概述了一种旨在改善基于人工智能的机械如何实时感知、交互和响应环境的混合方法,比如自动驾驶汽车如何移动和操控,或者机器人如何使用改进的技术来执行精确的动作。
计算机视觉允许人工智能通过解码数据和从图像中推断出的物理世界的属性来观察和理解周围环境。这些图像是通过光和机械的物理学形成的,而传统的计算机视觉技术则主要以基于数据的机器学习提高其性能。基于物理的研究已经发展起来,并正在探索许多计算机视觉难题背后的物理原理。
将物理学中控制质量定律、运动定律等内容整合到神经网络的开发中一直是一个挑战,人工智能在神经网络中以模仿人类大脑的方式运行,其具有数十亿个节点来处理庞大的图像数据集,直到它们理解它们“看到”的东西。但现在有一些很有前途的研究,尝试将物理意识的元素添加到强大的数据驱动网络中。
加州大学洛杉矶分校的研究旨在利用数据的深度知识和现实世界的物理知识,创造出具有增强功能的混合人工智能。
该研究的通讯作者、加州大学洛杉矶分校塞缪尔工程学院电子与计算机工程助理教授 Achuta Kadambi说:“汽车、机器人以及使用图像感知的医疗器械等视觉机器,终将会使用物理知识得以实现。并且物理感知的推理形式可以使汽车更安全地行驶、使手术机器人更精确。”
研究小组概述了物理学和数据结合到计算机视觉人工智能中的三种方式:
1、将物理学整合到AI数据集中:给物体加上像游戏中的角色那样的附加信息,如它们的移动速度或重量。
2、将物理规律整合到网络架构中:通过网络过滤器运行数据,将物理属性编码到摄像头捕捉到的图像中。
3、将物理纳入网络损失函数:利用建立在物理基础上的知识来帮助人工智能根据它所观察到的内容解释训练数据。
这三条研究路线已经在改进计算机视觉方面取得了重要的成果。例如,混合方法让人工智能更精确地跟踪和预测物体的运动,并可以从恶劣天气遮挡的场景中生成准确的高分辨率图像。
研究人员表示,随着这种双模态方法的不断进步,基于深度学习的人工智能甚至可能开始自己学习物理定律。
来源:https://techxplore.com/news/2023-06-hybrid-ai-powered-vision-combines-physics.html