谷歌原计划在11月份推出其对话式AI项目Gemini,但已悄悄地将其推迟到2024年初。
世界还需要等待一段时间才能体验谷歌迄今为止最复杂的人工智能模型的推出。
Gemini被描述为下一代AI和多模态,意味着它可以处理多种类型的数据,据说包括文本和图像以及其他类型的内容 - 例如网站。 - 具有根据草图理解和生成的能力。书面描述。
据两位了解决定的匿名消息人士的报道说,原定于下周在纽约,华盛顿和加利福尼亚举行的未经宣布的发布活动,由于AI在回应一些非英语提示和查询时不可靠的直觉,而被悄悄地重新安排到2024年初。
尽管它还没有公开发布,但据说Gemini会超越OpenAI的GPT-4,因为它使用的计算能力比它的竞争对手多得多。
“我看到了一些非常惊人的东西,”谷歌副总裁兼经理Sissy Hsiao之前告诉媒体。谷歌副总裁兼Bard和Google Assistant经理,Sissie Hsiao在谈到Gemini时说道:“就像,我正在尝试烤蛋糕,给我画3张照片如何给三层蛋糕加冰的步骤,Gemini实际上会创造出这些图像。”
Hsiao说:“这些都是全新的图片。这些不是从互联网上取得的图片。它现在能够用图像,而不仅仅是文本,与人类沟通。”
尽管谷歌已经有了自己的生成式AI模型,叫做Bard,但ChatGPT到目前为止一直享有强大的消费者认知度,但分析师认为,当Gemini最终推出时,这可能会发生变化。