审核专家:郑远攀

郑州轻工业大学教授

不知道大家还记不记得在佩顿·里德执导的《蚁人2》中,当反派想问出主人公斯科特·朗的下落时,给他的朋友路易斯注射了一剂“吐真剂”。这针药物直接让路易斯什么都往外说,把主人公的情感生活都快抖落干净了。

来源丨《蚁人2·黄蜂女现身》剧照

而就在近日的《自然》(Nature)子刊上,来自德克萨斯大学的科学家们发表了一篇论文,文中提到他们在大型语言模型的助力下,开发出了一种现代“读心机”,虽然它不能让你直接“说真话”,但却可以将你的大脑活动转换成清晰的图像或语言直接表述出来。

研究人员为收集大脑活动数据做准备来源丨Nolan Zunk/The University of Texas at Austin

原本电影不过是电影,但现代“读心机”却打破了人们的认知。在这种“读心机”诞生之前,最接近“吐真剂”的设备应该是测谎仪,然而它也是通过心跳和脑电波等情绪上的起伏来间接反映人到底有没有撒谎。所以这款“读心机”到底是如何做到的呢?

1 AI如何直接读取思维?

直接读取思维,或者说是“思维解码”,是指能够直接从大脑中提取和解析思维的过程。这个过程涉及到诸如神经元活动模式的识别,以及将这些模式与特定的思维或感知相关联。
2023年5月1日,美国德克萨斯大学奥斯汀分校的研究人员在Nature Neuroscience期刊发表了题为《Semantic reconstruction of continuous language from non-invasive brain recordings》的研究论文。

该研究开发了一种名为语义解码器的新型人工智能系统,只需要分析功能磁共振成像(functional magnetic resonance imaging, fMRI)数据,就可以以非侵入性的方式,将参与者大脑中所想的故事甚至图像翻译成连续的文本流。这一系统可能会帮助那些有精神意识但无法说话的人(例如中风患者、聋哑人)进行清晰的交流。

有意思的是,这项研究工作部分依赖于大语言模型(Large Language Models,LLM),而大语言模型正是最近爆火的人工智能聊天软件 ChatGPT 的基础。

来源丨Nature Neuroscience期刊上的论文截图

在训练系统阶段,科学家们让志愿者躺在fMRI机器中,在接受fMRI扫描的同时从耳机中听取播客(Podcast)故事。在训练阶段,研究人员利用基于GPT-1的大型语言模型,将参与者fMRI数据显示的大脑活动,与播客故事里的语言特征联系起来。

语义解码器的训练流程图来源丨Semantic reconstruction of continuous language from non-invasive brain recordings

志愿者接收几十个小时播客故事后,研究人员会让志愿者听一个全新的故事,这一次,他们要求解码器根据志愿者的大脑活动,输出语言来描述志愿者听到的故事。实验结果显示,这一系统能够仅根据志愿者的fMRI数据,描述出志愿者听到的故事,虽然达不到100%的准确度,但是它能够读出志愿者大脑中想到的故事的大意。

志愿者听到的语句(左)和解码器根据大脑活动解读的语句(右),蓝色代表完全一致的词汇,紫色代表大致准确的词汇来源丨Semantic reconstruction of continuous language from non-invasive brain recordings

除了可以将文字故事解读出来外,这个系统还能解码图像内容。在实验中,研究人员让参与者观看一小段没有语音或文字的动画视频,然后解码器可以根据参与者的大脑活动,输出语言描述视频中发生的事件。

解码系统在实验中将志愿者看到的视频中发生的故事用语言描述出来来源丨Semantic reconstruction of continuous language from non-invasive brain recordings

但这项研究也带来了一个全新的隐私问题——一些不怀好意的人是否可以通过语义解码器窃取他人大脑中的想法呢?论文通讯作者 Alexander Huth 教授表示,语义解码器是量身定做的,在使用前需要经过十几个小时的训练,志愿受试者需要保持完全静止,并将精神集中注意在他们正在听的故事,该系统才能真正发挥作用。此外,研究团队也在没有接受过培训的人身上测试了该系统,其解码结果与实际相差甚远。

2 目前的进展

尽管我们目前还远未能完全解码人类思维,但我们还是取得了一些关键的进步。例如,在今年三月份,来自日本京都大学的科学家们已经成功地使用AI解码出了人们看到或在大脑中想象的图像,甚至是他们正在听的或想象的语言。该研究论文发表在《生物杂志》网络版上,作者说:“在这里,我们提出了一种新的图像重建方法,在这个方法中,图像的像素值被优化,以使其深层的神经网络特征与人类大脑活动的多个层面的解码相似。”“虽然我们的模型只接受自然图像的训练,但我们的方法成功地将重建过程推广到人工形状,这表明我们的模型确实'重构’或'生成’大脑活动的图像,而不是简单地匹配样本。

来源丨见水印

该项技术的核心在于当人在观察一幅图像时,会在脑海中复刻这张图像,AI通过特定的算法将志愿者的fMRI信号和图片的DNN(Deep Neural Networks深度神经网络)特征关联,继而训练可以读取你思维的AI。不过需要强调的是,目前的研究大多依赖于粗糙的大脑成像技术和有限的数据。因此能解码的思维种类和精度都还有限。

第一行是真实图片,后三行是AI衍生的图片来源丨见水印

除了准确度,延时也是一个有待解决的问题。

仪器与人类的交互时读取处理信息等都需要时间,且不同的人大脑的活动方式也有差异,这对于系统的处理性能也是一个不小的挑战。此外,fMRI需要参与者躺在特定的机器里才能收集到可靠的数据,这种苛刻的条件要求会对未来的推广带来不小的阻碍。

3 未来的可能

未来,随着大脑成像技术的进步和更多的数据可用,我们将有可能训练出能够解码更复杂、更精细的思维的AI。这不仅可能使我们能够更深入地理解大脑和思维,也可能开启全新的交流方式,如帮助行动困难的人群直接用思维控制界面,或者可以理解语言障碍人群的思维。

来源丨pixabay

然而,能读取思维的AI也带来了一系列道德和伦理问题。例如,谁有权访问我们的私人思维?我们应该如何保护思维隐私?这些都是我们在开发这项技术时必须面对和解决的问题。

目前,我们还暂时不用担心该项技术会对人类隐私带来什么威胁,因为每个实验的成功进行都需要志愿者的高度配合。如果你不想被机器读取到你的思维,可以通过走神来树立无懈可击的屏障。

总的来说,AI直接读取人类思维是一个充满挑战和机遇的领域。它和其他所有的革新科技一样,是一把双刃剑,它可以为人类提供福祉,也可能剥夺人类的隐私,引起巨大的伦理问题。如何发展它,如何利用它,都是值得我们深入思考和探讨的。

来源: 北京科学中心