1. はじめに:なぜ今、「声」が医療の焦点なのか
医師として診療現場に立っていると、もどかしく感じる瞬間があります。 それは、患者さんが診察室に入ってきた瞬間の「雰囲気」や「声のトーン」で、「あ、今日は調子が悪そうだ」と直感的に分かるのに、それを電子カルテに「数値」として残せないことです。
特に、うつ病などのメンタルヘルスや、喘息などの呼吸器疾患において、この「言葉にならない不調」をどう客観的に捉えるかは、長年の課題でした。
今回ご紹介する Sonde Health(ソンデ・ヘルス) は、まさにその課題に対し、「スマートフォンのマイク」という、誰もが持っているセンサーを使って解答を出そうとしている企業です。
彼らの技術は、私たちの「声」を、まるで血液検査のように客観的なデータに変えてしまいます。
【Startup Fact Sheet】
企業名: Sonde Health(ソンデ・ヘルス) プロダクト: Sonde Mental Fitness / Sonde Respiratory(音声ヘルス解析のAPI・SDKとして提供) 本拠地: 米国ボストン 創業: 2015年 核心技術: 音声バイオマーカー(Vocal Biomarkers) 出自: PureTech Health(ボストンのバイオベンチャー生成スタジオ)からのスピンオフ。技術の源流は MIT リンカーン研究所。 注目点: 言語の内容ではなく「音響」を解析するため、プライバシーと言語の壁を越えやすい設計になっている。
2. The Founder's Vision:戦場の技術を、平時の医療へ
Sonde Healthの技術のルーツは、実は「医療」ではなく「国防」にあります。 元々はMIT(マサチューセッツ工科大学)のリンカーン研究所が、軍のパイロットや兵士のために開発していた技術でした。
極限状態にあるパイロットは、ストレスで判断能力が低下していても、無線では「大丈夫だ(I'm fine)」と気丈に振る舞うことがあります。 言葉は嘘をつきます。しかし、極度の緊張状態にある人間の声帯は、筋肉の微細な硬直や震えを起こし、本人の意思とは無関係にSOS信号を発しています。
この「声帯の生理的な変化」を検知する軍事技術を、一般の医療、特にメンタルヘルスや呼吸器疾患の早期発見に応用しようとしたのが、Sonde Healthの始まりです。
3. 言葉の意味は聞かない。「音」だけを診る
彼らのアプローチで最も興味深いのは、「あなたが何を話しているか(意味)」を一切無視するという点です。
SiriやAlexaのような通常の音声AIは、自然言語処理(NLP)を使って「会話の意味」を理解しようとします。 しかし、Sonde HealthのAIが解析するのは「音響特徴量(Acoustic features)」です。
具体的には、ユーザーにスマホに向かって6秒間「あー」と言ってもらう、あるいは定型文を読んでもらいます。 AIはその音声データから、以下のような数千もの特徴を抽出します。
- Jitter / Shimmer: 声の高さや大きさの微細な揺らぎ
- Breathiness: 呼気の混ざり具合(声門閉鎖の不全)
- Dynamic Range: 抑揚の幅
例えば、うつ状態にある患者さんの声は、独特の「平坦さ」や「協調性の欠如」を示します。喘息の患者さんの声には、耳では聞こえないレベルの「呼吸器の雑音」が混じります。
AIはこれらの音響的な特徴量を解析することで、会話の内容や使用言語に左右されることなく、声そのものから健康状態をモニタリングします。
4. どこで収益を上げているのか
Sonde Healthの事業モデルは、基本的に B2B2C / B2B です。 自社で一般向けアプリを大量に配るというよりも、他社のヘルスケアサービスやデバイスに「声の解析エンジン」を組み込んでもらうスタイルが中心です。
- API / SDK 提供 ヘルスケアアプリ、遠隔診療プラットフォーム、保険会社向けの健康管理サービスなどに対して、 「音声データをSondeの仕組みに渡すと、メンタルヘルスや呼吸状態のスコアが返ってくる」という“部品(機能)”を提供しています。 開発者はその部品(=API / SDK)を自分たちのアプリに組み込むことで、声の解析機能を簡単に追加でき、Sondeはユーザー数や利用回数に応じて利用料を得ています。
- チップセット・ライセンスの構想 Qualcomm のようなチップメーカーやスマホメーカーと連携し、将来的にはOS/チップレベルで音声解析エンジンを統合してもらうことで、 端末出荷台数に応じたライセンス収入を得ることも視野に入れています(こちらは中長期のオプションに近い段階と考えられます)。
このように、いまはソフトウェアとしてのAPI/SDKビジネスで収益を上げつつ、将来の「インフラ化(端末標準機能化)」を狙っている、という二層構造になっています。
5. 何が「参入障壁」になっているのか
音声バイオマーカーの世界では、「アルゴリズム」以上にデータの質と量が勝敗を分けます。Sonde Healthは、
- 85,000人以上から収集した、120万件超の音声サンプル
- うつ病、ストレス、呼吸器疾患など、医療的評価とペアになったラベル付きデータ
といった大規模な「健康音声バンク」を保有しているとされています。
さらに重要なのは、Sondeのアルゴリズムが 言語非依存(Language Agnostic) を志向している点です。
- 「何を話したか(テキストの意味)」ではなく、「どう話しているか(音響特徴)」だけを見ているため、 英語でも日本語でも、ヒンディー語でも、基本ロジックは共通で使い回せる設計になっています(もちろん国・言語ごとの微調整は必要です)。
この設計により、
- プライバシーの観点から、「会話内容そのもの」を扱わずに済む
- 多言語展開の際に、ゼロから学習し直すコストを抑えられる
という二重のメリットがあり、これが データ面・プライバシー面での参入障壁(Moat) として機能しています。
6. なぜこれが「発明」なのか
一人の医師として、Sonde Healthが秀逸だと感じる点は3つあります。
① 「受動的(Passive)」であること 医療アプリの最大の敵は「面倒くささ」です。毎朝体温を入力したり、気分を点数化したりするのは、健康な人でも続きません。
しかし、Sondeの技術は、将来的には「電話で誰かと話している間」にバックグラウンドで健康チェックを済ませることができます。ユーザーの努力を必要としない(Frictionlessな)健康管理は、継続率において最強です。
② ハードウェアへの依存脱却 Apple Watchのような高価なウェアラブルデバイスは素晴らしいですが、全ての高齢者が購入できるわけではありません。
Sonde Healthは「マイク」さえあれば機能します。つまり、何年も前の古いスマホでも、ガラケーでも、あるいはスマートスピーカーでも、そこにマイクがある限り「医療機器」になり得るのです。これは、途上国医療や高齢者医療において計り知れないメリットです。
③ 「嘘」をバイパスする客観性 診療現場で「調子はどうですか?」と聞くと、正直に詳しく話してくださる方も多い一方で、「大丈夫です」「変わりないです」と簡潔に答えられる方も少なくありません。
遠慮や気遣いから症状を控えめに表現する場合もあれば、ご本人自身が変化に気づいていない場合もあります。
声という「バイオマーカー(生体指標)」は、こうした主観や遠慮の影響をある程度乗り越えて、身体の状態の変化を客観的に捉える手がかりになり得ます。
テクノロジーは、いまや「言葉の意味」だけでなく、「声の出し方」そのものから体調や心の状態を読み取ろうとしています。
たとえば、毎朝アラームを止めるときの一言から、「少し疲れがたまっていそうです」とスマートフォンが静かに知らせてくれる未来が来るかもしれません。
医療やヘルスケアは、病院の中だけではなく、私たちの日常生活の中にも少しずつ入り込み始めています。