越来越真实的AI让人们开始质疑它是否有情感,甚至到了可以操纵情感的地步。
Hume AI的创始人兼CEO Alan Cowen在最近的一次采访中表示,“...它只是一个没有感情的AI,但也许它让你觉得它有感情。”
进入共情AI时代
“我认为,理解人们的情绪反应是真正学习如何满足人们喜好的关键,”Cowen说道,他介绍了世界上首个共情AI——EVI。
Cowen说:“如果你感到困惑,它可以为你澄清;如果你感到兴奋,它可以增强这种兴奋感;如果你感到沮丧,它可以安抚你。”
大多数情况下,这也关乎用户体验和AI系统如何与其用户互动。“在客服通话中,我们可以预测某人的通话是否愉快……有时根据上下文,预测的准确率高达99%,而仅根据语言本身,准确率约为80%。”Cowen补充道。
Hume AI由加州大学伯克利分校和谷歌的前研究员Cowen于2021年创立,是一家研究实验室和技术公司。该公司的使命是确保AI服务于人类的目标和情感福祉。
Cowen认为,语音界面很快就会成为我们与AI交互的默认方式。他说,语音比打字快4倍;它解放了眼睛和双手;而且语音的音调、节奏和音色中蕴含着更多信息。
“这就是为什么我们开发了首个具有情绪智能的AI,以理解语音背后的含义。根据你的声音,它可以更好地预测何时说话、说什么以及如何说。”他补充道。
最近,该公司从EQT集团、Union Square Ventures、Nat Friedman、Daniel Gross、Northwell Holdings、Comcast Ventures、LG Technology Ventures和Metaplanet筹集了5000万美元的B轮融资。
EVI API终于问世了!
该公司最近发布了情感语音接口(EVI)API,标志着首个具有情感智能的语音AI API的亮相。EVI现已上线,能够接收实时音频输入,并提供包含语音表达指标的生成音频和转录文本。
EVI基于10万次对话(平均每次对话时长为10分钟)和300万条用户消息,推出了创新功能,包括判断合适的发言时机以及用恰到好处的语气创作富有同理心的语言。
团队表示,EVI可根据客户需求进行配置,现在已具备调整个性、响应风格和语音内容的能力。该平台还支持Fireworks Mixtral8x7b,以及OpenAI和Anthropic模型。
此外,用户还可以连接到他们的WebSocket,构建自己的文本生成服务器,以确定对话中的所有EVI消息。他们还可以通过向API发送要朗读的文本来使用EVI的语音。
Cowen表示:“我们AI的强项在于通过其工具集赋予他人力量。我们的API是关键所在;它使用户能够定制他们的体验,并集成基本工具,如网页搜索。这关乎实现定制化和促进协作,让开发者在我们的接口基础上进行构建,并融入用户个性化设置。”
接下来会发生什么?
许多专家认为,理解情感智能的AI系统是未来的发展方向。Hume AI正处于完美的位置,准备彻底改变用户与AI系统的交互方式。
Cowen在谈到实现无缝多模态交互时表示:“在未来,你将希望在拥挤的地方与AI进行对话,同时也希望它除了理解你的面部表情外,还能理解你的语调,从而知道你什么时候说完以及你的感受。”
此外,他强调了个性化在AI通信工具中的重要性,以使其更具适应性和人性化。这对于AI直接与用户交互的应用至关重要,如客户服务、治疗或教育工具。
“我认为定制语音非常重要,个性也是,其中很多当然可以通过提示来实现;不过,你无法改变语音的底层口音和音质,因此我们也正在添加更多语音。”