谷歌的交互式Gemini引发与OpenAI的多模态AI大战

2024年05月14日 由 samoyed 发表 189 0

谷歌发布了一段预告视频,展示了其AI聊天机器人Gemini能够轻松响应语音和视频输入。


这段预告片仅在OpenAI展示ChatGPT-4o的几个小时前发布,ChatGPT-4o表现出了令人印象深刻的对话流畅性和理解力。


Google-Gemini-logo-on-smartphone-stock-photo-1-1280w-720h


AI聊天机器人大战正在升温,OpenAI和谷歌陷入了一场激烈的主导权争夺战。就在谷歌年度I/O大会之前几个小时,这家科技巨头发布了一段视频,展示了可能是更新版的Gemini聊天机器人,可以看到它能够处理实时视频输入和语音提示。


这段演示视频似乎是在I/O大会的筹备期间拍摄的,展示了Gemini在Pixel设备上的表现,它能够无缝处理实时视频和语音问题,提供准确的信息。当被问及正在进行的准备工作时,Gemini识别出它们是为一个大型活动所做的安排。


Screenshot-2024-05-13-135314


对话流畅自然,Gemini会询问用户注意到的细节,最终揭示该活动是谷歌I/O大会,并提供简洁的描述。


谷歌发布这段预告片的时间选择非常精准,它在OpenAI备受期待的ChatGPT升级发布前几小时就发布了。


如果你还没听说,OpenAI的ChatGPT-4o演示非常出色,展示了该AI无与伦比的流畅性和连贯性理解及对话能力。


虽然过去的经验可能会让我们对演示视频保持一定的怀疑态度,但今天的展示无疑证实了这些AI聊天机器人中语音和视频输入的无缝融合。这种多模态能力,结合对话的极其自然流畅,让我们窥见了AI交互的未来。


随着期待的升温,我们迫不及待地等待着谷歌明天的I/O主题演讲,届时该公司预计将发布新的AI功能和Gemini的更新。

文章来源:https://www.androidauthority.com/google-gemini-video-teaser-3442610/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消