ChatGPT推出高级语音模式:功能详解

2024年09月27日 由 daydream 发表 177 0

本周,OpenAI向期待已久的ChatGPT Plus和Teams用户推出了高级语音功能,企业和教育版用户将在下周获得访问权限。这一更新标志着AI驱动的语音交互取得了重大飞跃,为ChatGPT用户带来了更加自然和响应迅速的对话体验。


微信截图_20240927104553


高级语音功能利用了GPT-4o这一完全多模态模型,该模型经过训练,能够原生理解语音元素,与依赖独立文本到语音和语音到文本模型的“标准语音”对话有所不同。高级语音让用户与AI之间的交互更加流畅且具备上下文感知能力,能够捕捉语速等非言语线索,并以适当的情感进行回应。


要开始高级语音对话,只需点击屏幕右下角的语音图标即可。以下是高级语音带来的关键特性:


  • 新增五种语音,与现有语音一同,为用户提供九种独特个性的选择:Vale、Spruce、Arbor、Maple、Sol、Breeze、Cove、Ember和Juniper。
  • 改进的口音识别功能,支持更准确地跨多种英语方言进行交流。
  • 系统现支持超过50种语言,彰显了其增强的多语言能力。
  • 在语音对话中也可使用自定义指令和记忆功能,实现更加个性化的互动。


尽管新语音模式让人欲罢不能,但请注意,其使用限制会根据需求波动。OpenAI尚未明确指定Plus和Team用户的每日使用限制,但您会在剩余15分钟时收到通知。一旦达到限制,用户可以继续使用标准语音模式。


微信截图_20240927105128


值得注意的是,高级语音功能目前尚未在包括欧盟成员国、英国、瑞士、冰岛、挪威和列支敦士登在内的多个欧洲国家推出。


OpenAI已为语音交互实施了重要的隐私措施。对话中的音频片段会与聊天记录一起存储,并保留至聊天历史存在为止。若您删除聊天,音频将在30天内被删除,除非存在法律或安全要求。若您归档聊天,音频将被保留。


公司不会将语音聊天音频片段用于训练其模型,除非您明确通过“为所有人改进语音”设置在数据控制中选择了同意。


与ChatGPT进行高级语音模式交互的体验非常自然。通过整合多模态理解能力,系统能够提供更符合上下文且情感丰富的回应。这一发展可能为从客户服务到教育等多个领域的AI助手开辟更加复杂和高级的应用场景。


随着AI技术的不断进步,像高级语音模式这样的语音界面可能会在我们的日常数字交互中变得越来越普遍,提供一种更加直观和便捷的与人工智能互动的方式。

文章来源:https://www.maginative.com/article/chatgpt-advanced-voice-mode-what-you-need-to-know/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
写评论取消
回复取消