用 AI 模型重构人类大脑成像过程，Meta 发布重磅研究

原文来源：AIGC开放社区

图片来源：由无界AI生成

全球社交、科技巨头Meta（Facebook、Instagram等母公司）在官网公布了一项重磅研究，通过MEG（脑磁图）开发了一种AI模型用于解码人类大脑中视觉活动的成像过程，并公布了论文。

据悉，这是一种每秒可进行数千次大脑活动侦测的，非侵入式神经成像技术，可实时重构出大脑在每一刻感知和处理的图像。可为科学界理解大脑如何表达、形成图像，提供了重要研究基础。

从应用场景来看，该技术能更好地理解、控制ChatGPT、Stable Difusion等AI模型的神经网络行动、神经元，提升内容输出准确率降低风险，向AGI（通用人工智能）演变奠定了基石。

放眼更大的目标，将加速“脑机接口”在临床方面的研发进程，帮助那些遭受脑损伤失去说话能力的人。

论文地址：https://ai.meta.com/static-resource/image-decoding

技术原理

从Meta发布的论文来看，Meta通过MEG开发的AI模型原理并不复杂，主要包含图像编辑、大脑、图像解码三大模块。

当我们的大脑进行活动时,会产生微弱的电流。根据物理定律,这些电流会引起周围磁场的变化。利用MEG高度敏感的仪器检测这些磁场变化,从而获得脑部活动的数据。

具体来说,MEG使用特殊的超导扼流计作为探测器。这些扼流计由超导环路组成,可以精确地捕捉到磁场的微小波动。

探测器的位置经过精心设计,覆盖头部周围，测试者只需要坐在MEG仪器中保持头部静止即可。

，时长00:31

MEG重构实验者大脑成像，每个图像大约每1.5秒呈现一次。

虽然大脑电流活动引起的磁场强度非常微小,但MEG的探测器经过放大和处理就可以清晰地记录下来。

MEG包含200-300个探测器,每个探测器的位置都对应大脑的特定区域。这样,MEG可以获得高时间分辨率的全头脑活动数据。

，时长00:22

一旦获得原始的MEG数据,研究人员就可以利用强大的神经网络对其进行解码,提取重要的视觉信息，用于重构大脑图像。

Meta表示，最初想使用功能磁共振成像（fMRI）来搜集人类大脑的电流信息，但在图像分辨率、图像间隔以及连续性方面都不如MEG。

图像编辑模块

该模块基于多个预训练的计算机视觉模型,从输入图像中提取语义特征向量,作为解码的目标表示。研究人员比较了监督学习模型、图像-文本匹配模型、自监督模型等,发现CLIP和DINO的表现最佳。

CLIP(Contrastive Language-Image Pretraining)通过图像-文本匹配进行预训练,获得泛化能力强的视觉语义特征。DINO(Distributional Invariance for Normalization)是一种自监督对比学习方法。

以CLIP为例,可以提取图像模块(CLIP-Vision)的平均特征或分类标记(CLS)特征,文本模块(CLIP-Text)的平均特征,并拼接组合作为图像的语义特征表示。

大脑模块

该模块使用卷积神经网络,用于输入MEG数据窗口,输出是预测的图像特征向量。需要端到端训练,学习将MEG的数据映射到图像输出的latent space。

研究人员使用了卷积神经网络结构,包含残差块和膨胀卷积块,可以捕捉MEG时序信息。同时添加注意力层、主体专属层等机制。

为了进行图像检索,大脑模块以CLIP损失函数为目标,学习最大化匹配图像的特征相似度。为进行图像生成,大脑模块以MSE损失为目标,直接预测图像模块的特征。

图像解码模块

为了更好地解码图像，研究人员使用了latent diffusion扩散模型，将大脑模块预测的特征向量作为条件,可以生成与输入图像语义一致的新图像。

将大脑模块输出的CLIP语义特征和AutoKL特征作为条件,指导模型生成语义一致的图像。利用DDIM采样算法,以及噪声引导等技巧,逐步从噪声分布生成清晰的图像。一般采用50步采样过程。

最后，使用感知指标(SSIM)和语义指标(CLIP相似度、SwAV特征相关度),评估图像的解码、生成质量。

实验测试方面，研究人员使用包含4名参与者的MEG数据集THINGS-MEG,该数据集包含22,448张唯一的自然图像。

通过MEG的测试,研究人员发现大脑对图像的反应，主要集中在刺激出现后0-250ms的时间段，生成的图像能够保留语义信息。虽然生成的图像不是很完美,但结果表明重构的图像保留了丰富的高级特征。

本文来自用户投稿，不代表币大大立场，如若转载，请注明出处：https://czxurui.com/zx/92609.html

深入浅出，以太坊买图像究竟是什么意思？

深入浅出，以太坊买图像究竟是什么意思？在近年来数字浪潮的推动下,我们频繁听到“元宇宙”、“NFT”、“Web3”等新名词，当这些概念与加密货币领域的巨头“以太坊”相结合时，便诞生了“以太坊买图像”这样听起来有些奇特的表述，这究竟是什么意思？它背后又隐藏着怎样的技

币大大

2026-06-18 10:30:03

16 0

意欧交易所图像，全球资本市场的视觉坐标

意欧交易所图像，全球资本市场的视觉坐标在全球化资本浪潮中，交易所不仅是交易的场所，更是经济活力的视觉符号，意欧交易所（EuroNext Images）以其独特的图像叙事，构建了连接欧洲资本与实体经济的视觉桥梁,成为观察欧洲市场动态的重要窗口。意欧交易所的图像体系以“数据

币大大

2026-06-05 17:30:01

19 0

欧交易所图像，数字金融时代的视觉图腾

欧交易所图像，数字金融时代的视觉图腾在全球金融市场的数字版图上，欧交易所（Euronext）的图像标识已成为资本流动的视觉符号，那抹标志性的蓝色弧线如同一道跨越国界的经济桥梁，将阿姆斯特丹、巴黎、布鲁塞尔、都柏林、奥斯陆、米兰等金融中心串联成一张无形的交易网络，

币大大

2026-05-14 11:30:01

34 0

图像资料多少比特币，比特率的单位是什么

一、比特率的单位是什么***bps是什么意思比特币（BitCoin）的概念最初由中本聪在2008年提出，根据中本聪的思路设计发布的开源软件以及建构其上的P2P网络。比特币是一种P2P形式的数字货币。点对点的传输意味着一个去中心化的支付系统。与大多数货币不同，比特币不依靠特定货币

币大大

2024-12-05 12:30:01

228 0

BLUR第

本文目次导读：切磋BLUR手艺在图像处置范畴的应用及开展BLUR手艺在图像处置中的应用开展趋向切磋BLUR手艺在图像处置范畴的应用及开展BLUR手艺BLUR手艺是一种在图像处置中常用的手艺，它能够使图像中的某些部门变得模糊不清。那种手艺能够

币大大

2024-05-19 06:00:07

299 0

游客 2025年11月09日

应该完蛋了，还吹牛逼

评论于 itc万物链能涨到多少，万物链ITC上市后的情况哪位了解
zy 2025年10月30日

送啥谁

评论于矿机挂什么网站，GEC矿机是骗局么
网友 2025年07月13日

https://fg.zkaea2.com/045/index.html#/

评论于香港交易所网址：打开金融世界之门
网友 2025年07月13日

https://fg.zkaea2.com/045/index.html#/

评论于香港交易所网址：打开金融世界之门
Davidsaw 2025年07月01日

https://graphcommons.com/u/budvacarme

评论于离线比特币怎么使用，离线生成的比特币地址是如何避免冲突的

用 AI 模型重构人类大脑成像过程，Meta 发布重磅研究

OKX欧易app

发表回复

评论列表（0条）

用 AI 模型重构人类大脑成像过程，Meta 发布重磅研究

OKX欧易app

相关推荐

发表回复

评论列表（0条）