谷歌发布了一段预告视频,展示了其AI聊天机器人Gemini能够轻松响应语音和视频输入。
这段预告片仅在OpenAI展示ChatGPT-4o的几个小时前发布,ChatGPT-4o表现出了令人印象深刻的对话流畅性和理解力。
AI聊天机器人大战正在升温,OpenAI和谷歌陷入了一场激烈的主导权争夺战。就在谷歌年度I/O大会之前几个小时,这家科技巨头发布了一段视频,展示了可能是更新版的Gemini聊天机器人,可以看到它能够处理实时视频输入和语音提示。
这段演示视频似乎是在I/O大会的筹备期间拍摄的,展示了Gemini在Pixel设备上的表现,它能够无缝处理实时视频和语音问题,提供准确的信息。当被问及正在进行的准备工作时,Gemini识别出它们是为一个大型活动所做的安排。
对话流畅自然,Gemini会询问用户注意到的细节,最终揭示该活动是谷歌I/O大会,并提供简洁的描述。
谷歌发布这段预告片的时间选择非常精准,它在OpenAI备受期待的ChatGPT升级发布前几小时就发布了。
如果你还没听说,OpenAI的ChatGPT-4o演示非常出色,展示了该AI无与伦比的流畅性和连贯性理解及对话能力。
虽然过去的经验可能会让我们对演示视频保持一定的怀疑态度,但今天的展示无疑证实了这些AI聊天机器人中语音和视频输入的无缝融合。这种多模态能力,结合对话的极其自然流畅,让我们窥见了AI交互的未来。
随着期待的升温,我们迫不及待地等待着谷歌明天的I/O主题演讲,届时该公司预计将发布新的AI功能和Gemini的更新。