MetaのAIが脳反応を予測、脳科学研究の常識を覆すか

一言で言うと

Metaが開発したAIモデル「TRIBE v2」は、人に画像や音声や文章を見せたとき、脳が典型的にはどう反応するかを予測するモデルです。狙いは、時間も費用もかかる脳科学実験を補助することにあります。

何が起きているのか

この研究でAIに入れているのは、脳波や血液データではありません。人に `画像・音声・文章` を見せたり聞かせたりしたときの `刺激そのもの` です。そして、その刺激を受けた人間の脳が実際にどう反応したかを、機能的磁気共鳴画像法（fMRI: Functional Magnetic Resonance Imaging）で測った結果と組にして学習させています。fMRIは脳の血流と酸素レベルの変化を追う方法で、神経活動そのものではなく、その代理指標を見ています。

つまり、やっていることは `刺激 → 脳反応` の対応表づくりです。TRIBE v2は720人から得られた1,000時間以上のfMRIデータを使って、`この刺激なら脳は典型的にはこう反応する` という地図を学びます。入力は動画、音声、テキストで、それぞれを別のモデルで特徴量に変換したあと、最終的に70,000個のボクセルからなる脳反応マップとして出力します。

面白いのは評価のされ方です。この研究は、AIの予測が `個人の1回のfMRI` より優れていると主張しているのではありません。むしろ、1人1回のfMRIにはノイズやばらつきがあるため、AIが大量データから学んだ `典型的な脳反応パターン` が、個々の単発スキャンよりも `集団平均に近かった` と示しています。特に、高信号品質の7テスラfMRIスキャナーで取得されたHuman Connectome Projectデータでは、その傾向がより強く出たとされています。

このモデルは、顔、場所、言語処理といった既知の脳領域の反応も再現しています。ただし、限界もあります。fMRI自体が時間分解能の遅い手法であること、扱う刺激が視覚・聴覚・言語の3種類に限られること、そして `意思決定や行動そのもの` を直接モデル化しているわけではないことです。Metaは、このモデルのコード、重み、インタラクティブなデモを公開しています。

AI業界の文脈では

この研究の価値は、`刺激を与えて毎回fMRIを回す` という高コストな実験だけに頼らず、まずAIで典型反応を予測し、仮説を絞り込める可能性を示した点にあります。脳科学の実験を置き換えるというより、実験を補助し、どこに注目すべきかを事前に見立てる道具になりうるわけです。

将来的には、AIが予測する `典型的な反応` と、実際の患者の反応のずれを見ることで、疾患や機能障害の手がかりを探る方向にもつながりえます。ただし、今回の研究自体はまだその前段階で、まずは脳反応の標準地図をどこまで安定して再現できるかを確かめている段階です。

私の見立て

本質は、AIが `脳を読めるようになった` ことではありません。`この刺激なら人間の脳はだいたいこう反応する` という典型パターンを、実験データから再現できる段階に近づいたことです。これは、ノイズの多い単発測定をそのまま読むのではなく、背景にある共通パターンを取り出す試みとして重要です。

医療の観点では、これがすぐ診断に使えるわけではありません。ただ、脳疾患、リハビリ、創薬の研究で、`どの刺激にどんな反応が起きるのが標準か` をより整理しやすくなれば、研究効率は大きく上がります。まずは基礎研究の道具として価値があり、その先に医療応用がある、と見るのが現実的です。

→ 何が変わるか: 脳科学では、刺激と脳反応の対応を調べる実験を、毎回ゼロから行うだけでなく、AI予測を使って仮説を絞り込む進め方が広がる可能性があります。

→ 何をすべきか: 医療機関や研究者は、AIを使った脳機能解析を `すぐ診断に使う技術` と見るのではなく、まずは研究を効率化する基盤技術として捉え、実測データとの組み合わせ方を検討すべきです。