图像生成AI正越来越善于根据人们的fMRI数据重建他们正在看的东西。但这还不是读心术——至少现在还不是。
功能性磁共振成像(fMRI)是理解我们如何思考的最先进工具之一。当一个人在fMRI扫描仪中完成各种心理任务时,这台机器会产生令人着迷的彩色图像,展示他们的大脑活动。
通过这种方式观察某人的大脑活动可以告诉神经科学家一个人正在使用哪些大脑区域,但不能告诉这个人正在想、看或感觉什么。几十年来,研究人员一直试图破解这个密码——现在,使用人工智能来处理数据,他们取得了 serious 的进展。日本的两名科学家最近将fMRI数据与先进的图像生成AI结合起来,将研究参与者的大脑活动翻译回图片,这些图片与他们在扫描期间观看的图片惊人地相似。
技术原理
该研究中使用的脑部扫描来自一个研究数据库,其中包含一项早期研究的结果,在该研究中,八名参与者同意定期躺在fMRI扫描仪中,并在一年内观看10,000张图像。结果是一个巨大的fMRI数据存储库,显示了人类大脑的视觉中心(或至少这八名参与者的)对看到每张图像的反应。
为了生成重建的图像,AI模型需要使用两种不同类型的信息:图像的低层次视觉属性及其高层次含义。例如,它不仅仅是一个蓝色背景前的有角度的、 elongated 的物体——它是天空中的一架飞机。大脑也处理这两种信息,并在不同区域处理它们。
为了将脑部扫描和AI连接起来,研究人员使用线性模型将处理低层次视觉信息的各部分配对。他们还对处理高层次概念信息的各部分做了同样的处理。然后,AI模型可以学习一个人的大脑活动中的哪些微妙模式与图像的哪些特征相对应。
局限性与伦理考量
尽管这项技术听起来很神奇,但它有很多局限性。每个模型都必须只用一个人的数据进行训练。“每个人的大脑都非常不同,”拉德堡德大学的计算神经科学家Lynn Le说。如果你想让人工智能从你的脑部扫描中重建图像,你必须训练一个定制的模型——为此,科学家需要来自你大脑的大量高质量fMRI数据。
Jain解释说,即使有这些数据,AI模型也只擅长于它们被明确训练过的任务。一个训练用于处理你如何感知图像的模型,对于试图解码你在思考什么概念是不起作用的——尽管包括Jain团队在内的一些研究团队正在为此构建其他模型。
目前还不清楚这项技术是否能用于重建参与者仅凭想象而非亲眼看到的图像。这种能力对于该技术的许多应用都是必要的,例如使用脑机接口帮助那些无法说话或做手势的人与世界交流。
Jain说:“从神经科学的角度来看,构建解码技术有很多可以获得的。”但潜在的好处也伴随着潜在的伦理困境,随着这些技术的进步,解决这些问题将变得更加重要。“现在就是考虑隐私和这项技术的负面使用的时候了,即使我们可能还没有到可能发生这种情况的阶段,”她说。