OpenAI已将其ChatGPT的高级语音模式功能扩展至网页端,使用户能够直接在浏览器中与该AI聊天机器人进行语音对话。此消息由公司首席产品官Kevin Weil宣布。
本周,该功能面向ChatGPT的付费用户推出,包括Plus、Enterprise、Teams和Edu订阅用户。此前,高级语音模式已在ChatGPT的iOS和Android应用中于9月亮相。
高级语音模式利用OpenAI GPT-4的原生音频能力,实现用户与ChatGPT之间的自然、实时对话。聊天机器人能够理解并回应非言语线索,如语速等,并具备情感回应的能力。
在网页端启动语音对话时,用户需点击ChatGPT提示窗口右下角的语音图标,并授权浏览器访问计算机的麦克风。随后,用户将进入一个中央带有蓝色圆球的屏幕。
ChatGPT提供九种输出语音选择,每种都有其独特的语调和特点。例如,“Arbor”声音表现出“随和且多才多艺”的特点,而“Ember”则显得“自信且乐观”。
Kevin Weil表示,OpenAI计划在“未来几周内”向免费用户推出该功能。
Plus和Team订阅用户在使用高级语音模式时,每天会受到一定的时间限制。根据该功能的相关帮助页面,每日限制可能会有所变动。当用户当天的高级语音使用时间剩余15分钟时,OpenAI将进行通知。免费用户则将在每月获得一次预览机会以试用该功能。