谷歌旗下的DeepMind部门推出了一款名为Genie的人工智能模型,这款模型具备将图像转化为视频游戏的能力。用户只需通过几个简单步骤,就可以利用它为平台游戏创造全新的游戏世界。
虽然Genie模型规模相对较小,只包含110亿个参数,但它的训练数据量却十分庞大。这款模型已经在超过20万小时的视频上进行了训练,这些视频记录了人们玩二维平台游戏的过程。由于这类游戏具有一定的规则性,Genie得以掌握与它们相关的动作机制和物理学原理。值得一提的是,这些训练视频并没有包含关于何时按下按钮或控制器的信息,但Genie仍然取得了相当不错的训练效果。
在实际应用中,Genie能够接收一张单一图像(无论是照片、草图还是由AI生成的图像),然后将其迅速转化为一个可通过用户控制进行互动的游戏环境。这种转化过程在一次操作中即可完成,非常高效。
然而,目前我们不应过分期待Genie能制作出高质量的游戏。毕竟,它仍然是一个研究项目,而非最终产品。由于Genie是在分辨率为160×90像素、每秒仅10帧的视频上进行训练的,因此它生成的“游戏”在分辨率和帧率方面相对较低。具体来说,这些游戏的分辨率较低,只能运行16秒,每秒1帧。
不过,Genie的基本概念已经得到了验证,并且有迹象显示,随着规模的扩大,它的性能将会得到显著改善。要实现这一目标,只需使用更长、分辨率更高的视频以及额外的计算能力即可。