Google推出了Gemini,这是一系列大型语言模型(LLMs),代表了该公司目前最雄心勃勃和最先进的AI项目。这个开创性的多模态模型是他们构建的最有能力和最通用的模型,承诺将彻底改变人们与技术的互动方式,并在不同领域解锁新的可能性。
第一个版本,Gemini 1.0,已针对不同的应用进行了三种尺寸的优化:
Google表示,Gemini Ultra在用于AI研究的32个关键基准测试中的30个上超过了最先进的结果。这包括在广泛知识和问题解决能力的测试上首次超过人类。
与早期的模型只处理文本不同,Gemini从一开始就作为一个多模态模型被创建,它同时理解文本、图像、音频、视频和其他格式。它可以以其他任何AI系统目前无法实现的方式无缝地推理关联概念。
Google计划在未来几个月内在许多其产品中引入Gemini的功能。这包括对搜索、Pixel手机和Bard对话模型的升级。与此同时,开发人员和企业客户可以从12月13日开始通过Google AI Studio和Cloud Vertex AI访问 Gemini Pro。明年初,Google 将推出Bard Advanced,这是一个新的服务,提供对其最好的模型的访问,从Gemini Ultra开始。
Google在Gemini的持续开发中强调安全和监管是优先事项,并详细说明了来自内部和外部专家的广泛评估过程。然而,人工智能的快速发展和商业压力在社会上引发了越来越多的潜在弊端关注,Google承认将持续应对这些问题。
随着Google现在持有全球最强大的通用基础模型的称号,Gemini的发布是其AI旅程的一个定义性时刻。然而,随着OpenAI已经在即将推出的GPT-5模型上取得令人印象深刻的突破,2024年将成为AI领域又一个激动人心的一年。