哈工程研究人员设计一种AI算法,可以对水下照片进行除雾和着色
2020年01月01日 由 KING 发表
658523
0
我们现在看到的水下图像都是模糊并且失真,这是因为光衰减和反向散射等现象会对可见度产生不利影响。为了解决这个问题,许多研究人员与学者都做出了努力,Cambridge Consultants的DeepRay利用在100000个静止图像数据集上训练的GAN来消除由不透明玻璃板引起的失真,并且开源DeOldify项目采用了包括GAN在内的一系列AI模型来对旧图像和胶片进行着色和还原。 在9月微软亚洲研究中心的科学家详细介绍了用于自动视频着色的端到端系统。去年,Nvidia的研究人员描述了一种框架,该框架仅可以从一个着色和带注释的视频帧中推断出颜色。并于6月推出了 Google AI 一种无需人工监督就能为灰度视频着色的算法。
但是最近哈尔滨工程大学的研究人员贡献出了与以往不同结果。他们设计了两种机器学习算法,一种算法可以生成逼真的水下图像,第二种算法可以对这些图像进行训练,以恢复自然色彩并减少雾度。他们说,他们的方法在质量和数量上都与最新技术相匹配,并且能够在单个图形卡上每秒处理多达125帧。
该团队指出,大多数水下图像增强算法(例如那些调整白平衡的算法)都是不基于物理成像模型,这使其不适用于其它任务。相比之下,这种方法利用了生成对抗网络(GAN)(一种由生成器组成的AI模型,该生成器试图欺骗鉴别器将合成样本归类为现实样本),以生成一组特定调查地点的图像,并引入第二种算法,称为U-Net。该小组在带有标签的场景语料库上对GAN进行了训练,其中包含3733张图像和相应的深度图,主要是扇贝、海参、海胆以及其他生活在室内海洋农场中的此类生物。
训练后,研究人员将他们的双模型方法得出的结果与基线的结果进行了比较。他们指出此项技术具有以下优点:颜色恢复均匀,并且可以在不破坏原始输入图像基础结构的情况下很好地恢复绿色色调的图像。通常,它还可以在保持“适当”亮度和对比度的同时恢复色彩,其他的解决方案在此方面并不是特别熟练。