自然语言处理(NLP)和大型语言模型(LLM)的迅猛发展,催生了许多新型、针对特定需求的对话代理,能够回答各类查询。这些代理从提供学术支持的AI,到提供财务、法律或医疗建议的平台等,不一而足。
合肥工业大学和合肥综合国家科学中心的研究团队最近开发出了一款基于AI的平台,该平台虽然非专业,但可以为用户提供有用的心理支持。他们在阿姆斯特丹举行的国际多媒体建模会议上介绍了这款名为EmoAda的对话系统,该系统经过训练,能参与情感对话,为用户提供低成本的基础心理支持。
“我们的论文起源于对心理疾病,如抑郁症和焦虑症日益普遍的担忧,特别是在COVID-19大流行之后,以及专业心理服务供需的巨大差距。”论文的合著者小孙说。
“这项工作建立在各种研究工作的基础上,例如Fei-Fei Li等人通过口头语言和面部表情测量抑郁症严重程度的研究,小孙等人关于用于人格评估的多模态注意力网络的研究,以及基于AI的情感支持系统的发展,如Google的LaMDA和OpenAI的ChatGPT。”
这项研究的首要目标是创建一个成本效益高的心理支持系统,该系统能够根据不同的输入感知用户的情绪,产生个性化和富有洞察力的回应。这个系统并不是为了取代专业帮助,而是为了减轻压力,帮助用户提高精神灵活性,这一特征与良好的心理健康有关。
“EmoAda是一个多模态情感交互和心理适应系统,旨在向缺乏心理健康服务的人群提供心理支持。”小孙解释道,“它通过收集用户的实时多模态数据(音频、视频和文本),提取情感特征,并使用多模态大型语言模型分析这些特征,实现实时情感识别、心理特征分析和指导策略规划。”
小孙和他的同事们创建的EmoAda平台可以通过分析各种感官数据,包括用户的声音、面部视频和文本,来检测用户的情绪。基于这些分析,该系统会生成个性化的情感支持对话,并通过文本或数字化身来传递。
根据用户的需求和提到的困难,平台可能会建议各种可能有益的活动。其中一些活动是通过EmoAda平台上可用的内容来实现的,例如指导性的冥想练习和用于放松或缓解压力的音乐。
“在真实用户的测试中,EmoAda已证明能够提供自然和人性化的心理支持,”小孙说,“在这些试验中,我们发现一些用户更喜欢与AI交谈,因为它可以显著减少他们对隐私泄露和社会压力的担忧。与AI进行对话创造了一个安全、非评判性的环境,用户可以在其中表达他们的感受和担忧,而不用担心被评判或误解。像EmoAda这样的AI系统还提供全天候的支持,不受时间限制,这对于需要随时寻求帮助的用户来说是一个巨大的优势。”
在初步测试试验中,研究人员发现EmoAda最受赞赏的方面之一是它的匿名性。用户经常提到,他们感到很舒服地分享那些他们发现很难与他人面对面讨论的私人信息。
在未来,这个新的基于AI的系统可以作为那些无法负担专业心理护理或正在等待获得现有心理健康服务的人的基本支持服务。此外,EmoAda可以为其他研究团队提供灵感,为开发其他基于AI的心理健康相关数字平台铺平道路。
“我们接下来的研究将重点解决当前系统的局限性,包括优化多模态情感交互大型语言模型以减少误导信息的生成,提高模型干扰性能,降低成本,并整合心理学专家知识库以增强系统的可靠性和专业性。”小孙补充说。