Meta使用AI从脑部扫描中重建心理图像

2023年10月19日 由 daydream 发表 227 0

不久的将来,计算界面可能超越触摸屏和键盘,甚至超越眼睛和手势,进入我们的内心世界。


微信截图_20231019115059

尽管社会还没有达到这一点,但我们正在逐渐接近。Meta Platforms公司的研究人员今天宣布了一项名为Image Decoder的新型深度学习应用程序,该应用程序基于Meta的开源基础模型DINOv2,可以将大脑活动转化为高度准确的图像,几乎实时地展示出被观察者所看到或想象的内容。


换句话说,如果Meta的研究人员坐在一个屏障后,无法看到被观察者,即使被观察者身处世界的另一端,Image Decoder也可以让Meta的研究人员根据被观察者的大脑活动看到他们正在看什么或想象什么——前提是被观察者身处一个神经影像设施,并正在接受MEG仪器的扫描。


这些研究人员在Facebook人工智能研究院(FAIR)和巴黎PSL大学工作,他们在一篇新论文中更详细地介绍了他们的工作和Image Decoder系统。


Meta在电子邮件中写道:“这项研究加强了Meta对于理解人类智能基础的长期研究计划,识别其与当前机器学习算法的相似之处与不同之处,最终帮助构建具有像人类一样学习和推理能力的AI系统。"


Meta的Image Decoder如何工作


Meta的研究人员在论文中介绍了Image Decoder的技术基础。


本质上,它将两个迄今为止相当独立的领域结合起来:机器学习(特别是深度学习,其中计算机通过分析带有标签的数据并检查新数据并尝试正确标记它来进行学习)和脑磁成像(MEG),它是一种非侵入性地测量和记录脑活动的系统,利用仪器捕捉到脑部磁场的微小变化来判断人思考时的情况。


Meta的研究人员使用了来自四位病人(两名女性和两名男性,平均年龄23岁)的63,000个先前MEG结果进行了深度学习算法的训练,共进行了12个会话,病人在这些会话中看到了22,448个独特的图像和200个重复图像。


Meta团队使用了DINOv2,这是一个自我监督学习模型,旨在训练其他模型,Meta于2023年4月公开发布。


研究人员指示Image Decoder算法同时观察原始数据和当大脑产生MEG活动时被测试者实际看到的图像。


通过比对MEG数据和实际来源图像,算法学会解读大脑中具体的形状和颜色以及它们的表示方式。


有希望的结果和道德考虑


尽管Image Decoder系统还远非完美,但结果对研究人员来说是一种鼓舞,因为它在准确检索或重现基于MEG数据的图像方面的最高性能案例中的准确度达到了70%,比现有方法高出七倍。


Image Decoder成功从一组潜在图像中检索到的一些图像包括西兰花、毛毛虫和音箱柜。对于解码更复杂和多样化的图像,例如玉米饼、鳄梨和豆子,它的表现则较差。


微信截图_20231019115202

"总体而言,我们的发现为实验室和临床中实时解码视觉表征提供了一个有希望的途径。"研究人员写道。


然而,他们指出这项技术引发了"几个道德考虑"。


其中,研究人员提出的道德考虑中"最重要的是保护心理隐私",但他们并未明确说明如何实现这一点。


这项工作的资金来自一个已因违反消费者隐私而被罚款数十亿美元的母公司,这也是一个值得关注的问题,尽管研究人员没有直接提到这一点。


但是,由于技术上的限制,目前无法在未经被测试者同意的情况下使用该技术读取一个人的思维。Image Decoder最擅长解读人们曾经看到过的具体对象和景象。


"相比之下,当被测试者被要求想象图像时,解码准确性会明显降低。"研究人员指出。


此外,研究人员指出:"当参与者参与干扰性任务(如倒数)时,解码性能也会受到严重影响。换句话说,被测试者的同意不仅是法律上的要求,而且首要是技术上的要求。"


因此,如果未经受试者同意就对其大脑活动进行图像解码,受试者可以通过一些技术手段(如倒数)阻止这个过程,前提是他们知道这个选项并知道自己所处的情况。

文章来源:https://venturebeat.com/ai/meta-recreates-mental-imagery-from-brain-scans-using-ai/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消