用 AI 模型重构人类大脑成像过程,Meta 发布重磅研究

OKX欧易app

OKX欧易app

欧易交易所app是全球排名第一的虚拟货币交易所,注册领取6万元盲盒礼包!

APP下载   官网注册

原文来源:AIGC开放社区 用 AI 模型重构人类大脑成像过程,Meta 发布重磅研究

图片来源:由无界AI生成

全球社交、科技巨头Meta(Facebook、Instagram等母公司)在官网公布了一项重磅研究,通过MEG(脑磁图)开发了一种AI模型用于解码人类大脑中视觉活动的成像过程,并公布了论文。

据悉,这是一种每秒可进行数千次大脑活动侦测的,非侵入式神经成像技术,可实时重构出大脑在每一刻感知和处理的图像。可为科学界理解大脑如何表达、形成图像,提供了重要研究基础。

从应用场景来看,该技术能更好地理解、控制ChatGPT、Stable Difusion等AI模型的神经网络行动、神经元,提升内容输出准确率降低风险,向AGI(通用人工智能)演变奠定了基石。

放眼更大的目标,将加速“脑机接口”在临床方面的研发进程,帮助那些遭受脑损伤失去说话能力的人。

论文地址:https://ai.meta.com/static-resource/image-decoding 用 AI 模型重构人类大脑成像过程,Meta 发布重磅研究

技术原理

从Meta发布的论文来看,Meta通过MEG开发的AI模型原理并不复杂,主要包含图像编辑、大脑、图像解码三大模块。

当我们的大脑进行活动时,会产生微弱的电流。根据物理定律,这些电流会引起周围磁场的变化。利用MEG高度敏感的仪器检测这些磁场变化,从而获得脑部活动的数据

具体来说,MEG使用特殊的超导扼流计作为探测器。这些扼流计由超导环路组成,可以精确地捕捉到磁场的微小波动。

探测器的位置经过精心设计,覆盖头部周围,测试者只需要坐在MEG仪器中保持头部静止即可。



,时长00:31


MEG重构实验者大脑成像,每个图像大约每1.5秒呈现一次。

虽然大脑电流活动引起的磁场强度非常微小,但MEG的探测器经过放大和处理就可以清晰地记录下来。

MEG包含200-300个探测器,每个探测器的位置都对应大脑的特定区域。这样,MEG可以获得高时间分辨率的全头脑活动数据。



,时长00:22


一旦获得原始的MEG数据,研究人员就可以利用强大的神经网络对其进行解码,提取重要的视觉信息,用于重构大脑图像。

Meta表示,最初想使用功能磁共振成像(fMRI)来搜集人类大脑的电流信息,但在图像分辨率、图像间隔以及连续性方面都不如MEG。

图像编辑模块

该模块基于多个预训练的计算机视觉模型,从输入图像中提取语义特征向量,作为解码的目标表示。研究人员比较了监督学习模型、图像-文本匹配模型、自监督模型等,发现CLIP和DINO的表现最佳。

CLIP(Contrastive Language-Image Pretraining)通过图像-文本匹配进行预训练,获得泛化能力强的视觉语义特征。DINO(Distributional Invariance for Normalization)是一种自监督对比学习方法。 用 AI 模型重构人类大脑成像过程,Meta 发布重磅研究

以CLIP为例,可以提取图像模块(CLIP-Vision)的平均特征或分类标记(CLS)特征,文本模块(CLIP-Text)的平均特征,并拼接组合作为图像的语义特征表示。

大脑模块

该模块使用卷积神经网络,用于输入MEG数据窗口,输出是预测的图像特征向量。需要端到端训练,学习将MEG的数据映射到图像输出的latent space。

研究人员使用了卷积神经网络结构,包含残差块和膨胀卷积块,可以捕捉MEG时序信息。同时添加注意力层、主体专属层等机制。 用 AI 模型重构人类大脑成像过程,Meta 发布重磅研究

为了进行图像检索,大脑模块以CLIP损失函数为目标,学习最大化匹配图像的特征相似度。为进行图像生成,大脑模块以MSE损失为目标,直接预测图像模块的特征。

图像解码模块

为了更好地解码图像,研究人员使用了latent diffusion扩散模型,将大脑模块预测的特征向量作为条件,可以生成与输入图像语义一致的新图像。

将大脑模块输出的CLIP语义特征和AutoKL特征作为条件,指导模型生成语义一致的图像。利用DDIM采样算法,以及噪声引导等技巧,逐步从噪声分布生成清晰的图像。一般采用50步采样过程。 用 AI 模型重构人类大脑成像过程,Meta 发布重磅研究

最后,使用感知指标(SSIM)和语义指标(CLIP相似度、SwAV特征相关度),评估图像的解码、生成质量。

实验测试方面,研究人员使用包含4名参与者的MEG数据集THINGS-MEG,该数据集包含22,448张唯一的自然图像。 用 AI 模型重构人类大脑成像过程,Meta 发布重磅研究

通过MEG的测试,研究人员发现大脑对图像的反应,主要集中在刺激出现后0-250ms的时间段,生成的图像能够保留语义信息。虽然生成的图像不是很完美,但结果表明重构的图像保留了丰富的高级特征。

本站所有软件信息均由用户上传发布,版权归原著所有。如有侵权/违规内容,敬请来信告知邮箱:764327034@qq.com,我们将及时撤销! 转载请注明出处:https://czxurui.com/zx/92609.html

打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫

撰稿:Joyce,BlockBeats

编辑:Jaleel,BlockBeats

自今年年初以来,比特币的生态和叙事就随着 BTC 的价格徐徐上涨而热闹起来。而最近两周,比特币的价格达到了 18 个月来的新高,在昨天突破了三万五美元的大关。

比特币涨出的水溢到了 BRC20 和 Ordinals,让压抑许久的比特币生态社">

上一篇 2023年10月26日
下一篇 2023年10月26日

相关推荐

  • 图像资料多少比特币,比特率的单位是什么

    一、比特率的单位是什么***bps是什么意思比特币(BitCoin)的概念最初由中本聪在2008年提出,根据中本聪的思路设计发布的开源软件以及建构其上的P2P网络。比特币是一种P2P形式的数字货币。点对点的传输意味着一个去中心化的支付系统。与大多数货币不同,比特币不依靠特定货币

    2024-12-05 12:30:01
    14 0
  • BLUR第

    本文目次导读:切磋BLUR手艺在图像处置范畴的应用及开展BLUR手艺在图像处置中的应用开展趋向切磋BLUR手艺在图像处置范畴的应用及开展BLUR手艺BLUR手艺是一种在图像处置中常用的手艺,它能够使图像中的某些部门变得模糊不清。那种手艺能够

    2024-05-19 06:00:07
    201 0
  • Midjourney官方中文版内测申请火热进行中

    据最新消息,MidjourneyAI在微信发布了《Midjourney官方中文版·内测申请》的通知,邀请中国创作者加入Midjourney官方中文版的内测。Midjourney是一个由Leap Motion的创办人大卫·霍尔兹(David

    2023-11-12 08:01:58
    113 0
  • 300 张图“毒倒” SD,艺术家们的反击工具 Nightshade 要给 AI 绘画“上一课”?

    撰文:Melissa Heikkilä 来源:麻省理工科技评论 图片来源:由无界 AI生成 一种新的工具可以让艺术家们在将作品上传到网上之前,对其艺术作品中的像素添加不可见的更改,如果这些图片被收录进了 A

    2023-10-27 16:00:28
    84 0
  • OpenAI 为何放弃大模型 Arrakis?或许是一种战略重心转移

    图片来源:由无界 AI生成 尽管 OpenAI 接连推出了 ChatGPT、GPT-4、DALL-E 3 等成功的产品,但其实在这些成功的背后同样充满了挫折。OpenAI 也开发了一些中途夭折的大模型产品。 据 The In

    2023-10-19 16:00:03
    85 0
  • 「金色财经」谷歌将在搜索和浏览中添加人工智能功能

    「金色财经」根据金融报道,谷歌宣布将为谷歌搜索提供新的人工智能功能,包括利用公司最新的生成人工智能功能生成图像和书写灵感的能力谷歌的人工智能搜索体验(SGE)可生成与描述完全匹配的图像该功能扩展到谷歌图像,提供基于搜索查询的人工智能产生的视

    2023-10-15 07:00:02
    76 0

发表回复

8206
验证码

评论列表(0条)

    暂无评论

ok交易所
已有100万用户加入ok交易所

立即下载