AI模型MinD-Vis可以根据大脑活动读懂人的思想
简单来说
人工智能模型可以解释一个人看到的基于 大脑活动 - 就是这样
一种名为 MinD-Vis 的新人工智能模型可以根据大脑活动解释一个人所看到的内容。 该模型通过解释当一个人看到一个物体时大脑中存在的“助记不变量”来工作。 这些助记不变量是在同一对象的不同记忆中保存下来的模式。
为了获得大脑活动的全局嵌入,作者首先训练了一个自监督模型(不同的人相同)。 然后,他们使用预训练的 潜在扩散. 在对 1.5k 图片进行一些快速微调后,该模型能够完全破译一个人在他面前看到的东西——功能磁共振成像 对!
为了更好地理解人类视觉系统并为通过脑机接口连接人类和计算机视觉奠定基础,从大脑记录中解码视觉刺激试图扩大我们对视觉系统的理解。 大脑信号潜在表示的复杂性和数据注释的缺乏使得很难从大脑记录中重新创建高质量的准确图像。
根据实验结果,该策略在语义映射(100 路语义分类)和生成质量(FID)方面分别优于最先进的 66% 和 41%。 该模型已在定性和定量上进行了基准测试。 为了评估框架,还对消融进行了彻底的研究。
训练数据、代码和模型权重都对公众开放 请求.
研究人员认为,该模型可用于为盲人或视力低下的人开发假肢。 它还可以用来帮助患有记忆障碍的人,例如阿尔茨海默病。
了解更多:
免责声明
在与行 信托项目指南,请注意,本页提供的信息无意且不应被解释为法律、税务、投资、财务或任何其他形式的建议。 重要的是,仅投资您可以承受损失的金额,并在有任何疑问时寻求独立的财务建议。 如需了解更多信息,我们建议您参阅条款和条件以及发行人或广告商提供的帮助和支持页面。 MetaversePost 致力于提供准确、公正的报告,但市场状况如有变更,恕不另行通知。
关于作者
Damir 是团队领导、产品经理和编辑 Metaverse Post,涵盖 AI/ML、AGI、LLM、Metaverse 等主题 Web3- 相关领域。 他的文章每月吸引超过一百万用户的大量读者。 他似乎是一位在 SEO 和数字营销方面拥有 10 年经验的专家。 达米尔曾在 Mashable、Wired、 Cointelegraph、《纽约客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作为数字游牧者往返于阿联酋、土耳其、俄罗斯和独联体国家之间。 达米尔获得了物理学学士学位,他认为这赋予了他在不断变化的互联网格局中取得成功所需的批判性思维技能。
更多文章Damir 是团队领导、产品经理和编辑 Metaverse Post,涵盖 AI/ML、AGI、LLM、Metaverse 等主题 Web3- 相关领域。 他的文章每月吸引超过一百万用户的大量读者。 他似乎是一位在 SEO 和数字营销方面拥有 10 年经验的专家。 达米尔曾在 Mashable、Wired、 Cointelegraph、《纽约客》、Inside.com、Entrepreneur、BeInCrypto 和其他出版物。 他作为数字游牧者往返于阿联酋、土耳其、俄罗斯和独联体国家之间。 达米尔获得了物理学学士学位,他认为这赋予了他在不断变化的互联网格局中取得成功所需的批判性思维技能。