AIモデルMinD-Visは、脳の活動に基づいて人々の心を読むことができます
簡単に言えば
AIモデルは、人が見ているものをに基づいて解釈できます 脳活動 – これが方法です
MinD-Vis と呼ばれる新しい AI モデルは、脳の活動に基づいて人が見ているものを解釈できます。 このモデルは、人が物体を見たときに脳に存在する「ニーモニック インバリアント」を解釈することによって機能します。 これらのニーモニック不変条件は、同じオブジェクトの異なるメモリ間で保存されるパターンです。
脳活動の全体的な埋め込みを取得するために、著者は最初に自己教師ありモデルをトレーニングしました (さまざまな人についても同じです)。 次に、事前に訓練された 潜在拡散. このモデルは、1.5k 画像をすばやく微調整した後、人が目の前で見ているものを完全に解読することができました。fMRIを ペア!
人間の視覚系をよりよく理解し、脳とコンピューターのインターフェースを介して人間とコンピューターの視覚を橋渡しするための基礎を提供するために、脳の記録から視覚刺激を解読することで、視覚系の理解を深めることが試みられます。 脳信号の根底にある表現の複雑さとデータ注釈の不足により、脳の記録から高品質で正確な画像を再現することが困難になります。
実験結果によると、戦略はセマンティック マッピング (100 通りのセマンティック分類) と生成品質 (FID) で最先端技術をそれぞれ 66% と 41% 上回っていました。 このモデルは、定性的および定量的にベンチマークされています。 フレームワークを評価するために、アブレーションに関する徹底的な研究も行われました。
トレーニング データ、コード、およびモデルの重みはすべて、次のサイトで公開されています。 要求.
研究者は、このモデルを使用して、視覚障害者や弱視の人のための人工装具を開発できると考えています。 また、アルツハイマー病などの記憶障害を持つ人々を助けるためにも使用できます.
続きを読む:
免責事項
に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。
著者について
Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。
より多くの記事Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。