索尼互动娱乐公司正在开发至少一个其PlayStation游戏角色的AI驱动原型。近日,一段来自索尼PlayStation集团的内部视频被泄露,展示了《地平线:西之绝境》中主角艾洛伊的AI版本。随后,因版权公司Muso的版权主张,该视频已从YouTube上下架,而Muso的客户列表中包括索尼互动娱乐(即PlayStation)。
视频由索尼互动娱乐的软件工程总监Sharwin Raghoebardajal旁白,他负责游戏技术、AI、计算机视觉和面部技术等方面的工作,隶属于PlayStation Studios高级技术团队。视频中展示了AI驱动的艾洛伊如何在游戏过程中通过语音提示与玩家进行对话。
艾洛伊能够以AI合成的声音和面部动作回应玩家的查询,这一演示既在独立的演示环境中进行,也在完整的《地平线:西之绝境》游戏中展示。Raghoebardajal明确指出,这只是一个原型,是与Guerrilla Games合作开发的,用于在索尼内部展示这项技术。
技术演示使用了OpenAI的Whisper进行语音转文字,同时利用GPT-4和Llama 3进行对话和决策。索尼还拥有自己的内部情感语音合成(EVS)系统用于语音生成,而音频到面部动画的转换则是由索尼的Mockingbird技术提供支持。
尽管演示是在PC上运行的,但据Raghoebardajal透露,索尼也尝试了将这项技术的部分功能直接在PS5主机上运行,且“开销很小”。索尼首次在内部展示这项技术是在一年前,并在去年11月的东京索尼技术交流展(STEF)上闭门展示了更先进的版本。
Raghoebardajal表示,这只是展示了可能性的冰山一角。然而,这一技术演示并未回答一些显而易见的问题,比如在《地平线:西之绝境》中玩家本应扮演艾洛伊时,与她对话的意义何在,以及这种技术对配音演员和游戏开发者可能产生的影响。