OpenAI 正在为即将到来的“春季更新”活动做足准备,这场活动定于周一举行,届时预计将展示一款融合先进技术的全新AI模型。这款模型将集合最先进的语音识别、文本转语音以及图像分析功能于一身。
尽管首席执行官山姆·阿尔特曼(Sam Altman)和总裁格雷格·布罗克曼(Greg Brockman)已提前辟谣,明确表明OpenAI不会在此次活动中发布GPT-5或搜索引擎,但该公司确实计划向公众展示其AI技术领域的重大突破。《信息》报道称,OpenAI正研发一款AI语音助手,实力有望与谷歌助手和苹果的Siri等行业翘楚一较高下。
这款新型AI模型的独特之处在于其强大的整合能力,它建立在OpenAI现有的尖端模型之上。该公司已经开发了Whisper用于语音识别、Voice Engine用于文本转语音,以及GPT-4V(ision)用于图像分析。而这款新型模型将把这些功能完美融合,形成一个更加强大的系统,性能远超其前身。
据熟悉该技术的消息人士透露,OpenAI已经向部分客户展示了这款新型AI,展现了其在逻辑推理能力方面的显著改进。这款AI能够理解语调和讽刺,并据此提供更加准确、符合语境的响应。它不仅有可能成为学生的导师,帮助他们撰写论文或解决数学问题,还能提供关于用户周围环境的实时信息,比如翻译路标或提供汽车维修建议。
虽然这项新技术对于个人设备来说目前还较为耗费资源,但客户可以通过基于云的版本,来增强OpenAI软件已经具备的功能。整合后的模型的音频功能将有助于客户服务代理更好地理解呼叫者的语调或检测讽刺,从而实现更加准确、高效的交互。
OpenAI一直在积极研发GPT-5,阿尔特曼表示,GPT-5将比一年多前发布的GPT-4更加“聪明”。据与OpenAI领导人讨论过该项目的人士透露,该公司计划在年底前完成并公开发布GPT-5。
除了开发AI语音助手和GPT-5,OpenAI还在探索新的定价模式,以更好地满足客户需求。该公司计划为预付定金以预留令牌的客户提供高达50%的折扣,这一举措有助于OpenAI与注重成本效益的竞争对手模型开发者和AI服务器转售商展开竞争。
这款集成AI模型的发布,标志着OpenAI在开发人工通用智能的征途上又迈出了坚实的一步。因此,请务必在5月13日(星期一)上午10点(太平洋时间)标记您的日历,以免错过这一激动人心的时刻!