Takeshi Ikemoto

医療 × 経営 × テクノロジー

·夜便 1本目·

医療AIのボトルネックは「データ不足」——Mantis Biotechの「人体デジタルツイン」アプローチ

MantisBiotech人体デジタルツイン合成データ医療AI

一言で言うと

Mantis Biotechは、教科書・医療画像・センサー・動作データなど複数のソースを統合して、人の解剖・生理・行動を再現する「デジタルツイン」を構築し、希少疾患や特殊症例のように実データが集めにくい領域向けの合成データセットを提供しようとしています。医療AIのボトルネックである「良質なデータの不足」を、モデルの改善ではなくデータ生成という方法で突破しようとする試みです。

何が起きているのか

医療AIの開発において、最も大きな壁の一つがデータの量と質です。特に希少疾患、小児疾患、特殊な身体条件を持つ患者など、実例が少ない領域では、AIモデルの訓練や検証に必要なデータそのものが存在しません。プライバシー規制も加わり、医療データの収集や共有は民間企業にとってさらにハードルが高くなっています。 Mantis Biotechのアプローチは、この問題を正面から解こうとするものです。同社は `教科書などの文献` `医療画像` `ウェアラブルや医療機器のセンサーデータ` `動作・行動データ` など、種類の異なるデータを統合して、人体の解剖学的構造、生理的な反応、行動パターンを再現する「デジタルツイン」を構築します。このデジタルツインを使って、現実には集められない症例の合成データセットを生成し、研究者や製薬企業に提供するというビジネスモデルです。

「デジタルツイン」は、現実の対象の構造と振る舞いを計算機上で再現する考え方です。工学分野では、部品の形状、荷重、温度、摩耗といった変数を比較的明確に定義できるため、シミュレーションの精度を高めやすいという特徴があります。これに対して人体では、解剖学的構造だけでなく、代謝、免疫、ホルモン、既往歴、年齢、生活習慣など多数の要因が相互作用するため、単純なデータ当てはめだけでは再現が難しくなります。そこでMantis Biotechは、観測データをそのまま学習させるだけでなく、解剖学や生理学の既知の制約を物理モデルとして組み合わせることで、あり得る反応の範囲を絞り込み、現実に近い合成データを作ろうとしています。

AI業界の文脈では

医療AIの開発を支えるデータ基盤の問題は、業界全体で議論が続いています。実データを使わずに合成データで補う方向性は、他社でも模索されており、GoogleMedPaLMMicrosoftの医療AI製品群でも、データ拡張や合成データの活用が研究されています。

一方、合成データには固有のリスクもあります。物理モデルや既存の医学知識に基づいて生成されたデータが、現実には起きにくい症例パターンに偏る可能性があります。また、合成データで訓練したモデルが実際の患者データに対してどれほど汎化するかは、実証が必要です。Mantis Biotechがどの領域でどれほどのデータ品質を実現できるかは、製品の価値を左右します。

創薬の文脈では、Eli LillyInsilico Medicineの大型契約(昨日も報じられた)が示すように、AIを使った候補発見・設計への投資が拡大しています。そこで試される候補の品質は、訓練・検証に使われたデータの質に依存するため、合成データの精度向上は創薬エコシステム全体の価値に直結します。

私の見立て

今回の記事の本質は、「データが足りないなら作る」という発想への注目が、医療AI分野でも高まっていることを示した点にあります。

医療機関の視点では、自機関にあるデータが「AI訓練に使えるほどの質と量があるか」を確認することが、外部の合成データサービスを使うかどうかの判断の出発点になります。特に希少疾患・稀少症例が多い専門病院や研究機関は、合成データの活用が研究の加速につながる可能性があります。

一方、合成データに依存したAIが臨床で使われるとき、そのデータの由来と検証状況を開示する体制が規制上どう扱われるかは、まだ明確ではない部分が多くあります。製品を評価・導入する立場では、「どんな合成データで訓練されたか」「実データとの比較検証が行われているか」を確認する習慣が、これから重要になってきます。

→ 何が変わるか: 医療AIの競争が「どれだけ良いモデルを持つか」だけでなく「どれだけ独自で高品質なデータ(合成含む)を持つか」に移行します。データ生成能力が、AI医療企業の差別化要因の一つになる可能性があります。

→ 何をすべきか: 医療機関や研究機関は、手元にある実データの整備と並行して、合成データを活用した研究・評価の事例を追い始めることが先手になります。特に、希少疾患・稀少症例を扱う機関は、外部の合成データサービスとの連携可能性を今から探索する価値があります。