バイオテクノロジー
マルチオミクスとAIを用いたヘルスケア:新しい薬剤発見のフロンティア

精密医療はヘルスケアの未来である
応用ハードサイエンスにおける進歩の源泉は、より正確な測定とツールの開発である。これは、特に物理学と化学において当てはまり、分析ツールは現在、実験に対する個々の原子の反応を観察できるようになり、クリーンエネルギー、材料科学、ナノテクノロジー、製造、コンピューティングの分野で急速な進歩を促している(関連トピックの記事はリンクを参照)。
しかし、精密測定が困難な科学分野の一つが生物学である。これは、生物は単純な材料ではなく、数百万、あるいは数十億個の異なる部品で構成される超複雑な分子機械だからである。
したがって、単一のヒト細胞の真正な表現は、数年前にウイルス的に広まったコンピューター生成の単一のヒト細胞の画像によって示されるように、ほとんど理解不能なほど複雑である。

ソース:Newsweek
これは、生物学的および生化学的現象の真正な理解を、持続的な課題としている。
ゲノミクスは、細胞が内部構成要素を構築するために使用するテンプレート/指示を説明する上で、重要な第一歩であった。別の成長要因は、AIの使用であり、先進的なニューラルネットワークは、人間の精神よりも大量のデータを処理できるからである。
これらを組み合わせると、ヘルスケアの変革を促進し、真正に個別化された精密医療の出現を促すことになる。これは、各個人の独自の遺伝子、代謝、医療歴などに合わせてカスタマイズされる。
現在、精密医療は5000億ドル規模の市場であり、モノクローナル抗体(2023年には2220億ドル規模の市場)や、CAR-T療法のような最先端のがん治療などを含む。
マルチオミクスとは何か
生体システムの驚くべき複雑さは、マルチオミクスの出現をもたらした。これは、生物科学のすべてのサブセグメントを統合する分野であり、バイオテクノロジーの次のステップとされている:
- ゲノミクス:細胞核内のDNAシーケンスの分析。
- トランスクリプトミクス:mRNAの分析。DNAの指示を運んでいる。
- エピゲノミクス:遺伝子シーケンスに影響を与えることなく、ゲノムの修飾。つまり、「エピジェネティクス」。
- プロテオミクス:タンパク質の分析。糖類による修飾(翻訳後)を含む。
- 代謝物分析:化学化合物と代謝の分析。
- 微生物オミクス:体内または体表に住むすべての微生物の分析。
- シングルセルマルチオミクス:個々の細胞に対するマルチオミクス分析。
- 空間生物学:特定のmRNA、タンパク質、または細胞の3Dでの位置の分析。

ソース:Ark Research
新しい分野が登場している。たとえば、アグリゲノミクス(農業生産量を向上させるためのゲノミクス)、生態学ゲノミクス(生態系の健康状態とその遺伝的多様性を正確に評価する)、または合成生物学(特定の目的を持つ新しい遺伝子、特性、または生物を作成する)などである。
これらの分野はすべて、新しい分析方法やナノテクノロジー、光学、半導体技術、コンピューティングパワーの革命的な進歩により、驚くべき進歩を遂げている。
しかし、生物科学と医学は、これらすべての新しいデータを処理し、さらに、すべての可能なオミクス分野間の複雑な相互作用を理解するのに苦労し始めている。
これは、個々の遺伝子、タンパク質、生物分子、細菌などが相互作用する可能性が、実際には数兆、または数千兆に上るからである。
そして、理論的には、真正に個別化された医療のために、このデータは各個人のために収集され、デジタルヘルスデータのレコードに接続されることになる。
コストの低下とデータの氾濫
分析ツールの技術的改善により、データの収集コストが急激に低下した。これは、たとえば、ヒトゲノムのシーケンシングのコストが30年間で100万倍以上に低下したこと、またはDNAシーケンシングが現在10000倍以上安くなったことなどがその例である。

ソース:Ark Research
これは、当初2001年に1つのゲノムをシーケンシングするのに45万ドルかかったのに対し、現在では同等の価格で14億ゲノムをシーケンシングできることを意味する。つまり、世界人口の約17%に相当する。
結果として、ゲノミクスや他のオミクスデータが生物学者を襲っている。
たとえば、最大の公開ゲノミクスデータベースであるUKバイオバンクには、メタが開発した最大のLLM(Large Language Model)であるLlama 405bを動かすデータの27倍のデータが含まれている。
世界中のすべての新生児がゲノムをシーケンシングされることが、近い将来に起こり得る慣行である場合、このデータはLlamaが使用するデータの10000倍になることになる。

ソース:Ark Research
幸いなことに、データの量が何千倍にも増えている一方で、デジタル分析ツール、特にAIの効率も何千倍にも増している。

ソース:Ark Research
薬剤発見への応用
バーチャルセル
最近までは、潜在的な新薬の効果を知るには、またはタンパク質が他のタンパク質とどのように相互作用するかを知るには、生物学者が実験を手動で実行する必要があった。これは費用がかかり、時間がかかる作業である。
これは、新薬の発見を遅くし、革新的な治療の医療費を高くした。
これは、インビトロ(研究室で)またはインビボ(生体内、通常は動物で)で実行できた。
新しい選択肢が最近登場した。コンピューターでシミュレートされた仮想細胞を使用するインシリコアプローチである。これらの仮想細胞はコンピューターでシミュレートされ、潜在的な新しい治療にさらされ、シミュレーションはそれがどのように反応するかを計算する。

ソース:Ark Research
シミュレーションの改善
ゲノムとトランスクリプトームの完全なデータに加えて、GoogleのAI AlphaFoldのようなタンパク質のフォールディングシミュレーターが、インシリコシミュレーションに導入されるようになった。
多くのタンパク質ベースの薬は、薬と細胞の受容体、または標的がん細胞または細菌の表面との相互作用に依存している。
タンパク質の3D構造(フォールディング)をインシリコで正確に予測することで、薬の開発の成功率と速度が大幅に向上し、コストが削減される。
AlphaFoldが2018年から500倍に向上したため、インシリコシミュレーションは、ほとんどのバイオテック企業にとって必須の技術になるだろう。

ソース:Ark Research
AlphaFoldと同様の技術を開発している他の企業もあり、たとえば、Schrödinger (SDRG )(「Top 5 AI & Digital Biotech Companies」で紹介)などが、非タンパク質分子向けにAlphaFoldと同様の技術を開発している。
がん検査
がんの早期発見は、がんがMRIスキャナーで見えるほど大きくない場合でも、しばしば命を救うことになる。
液体生検と呼ばれる新しい技術が、見えないがんを検出するという約束をもたらしている。これは、ゲノムシーケンシングツールを使用して、がん特有のDNAシーケンスを患者さんの血液から検出することで機能する。
液体生検は、実際の生検よりもはるかに侵襲性が低く、血液サンプルだけが必要である。複数の潜在的ながんを同時に検索することもできる。

ソース:Ark Research
2024年6月、Guardant Health (GH )の「Shield」大腸がんスクリーニング検査がFDAに承認された。Illumina (ILMN )からスピンオフしたGrail (GRAL )も、同様の検査を開発している企業である。
液体生検に加えて、がん患者が完治しているかどうかを確認するために、最小残存疾患(MRD)検査も普及しつつある。

ソース:Ark Research
MRDと液体生検の両方において、民間および国営の医療保険制度による報酬は、採用を促進するための重要な要素となる。
自動化された研究所
より多くのデータが必要になり、検出ツールのコストが低くなるにつれて、制限要因(コストと容量の両方で)は、Ph.D.レベルの資格を持つ人間の労力になる。
これは、サンプルの抽出などの手作業だけでなく、実験の設計も同様である。
新しい代替方法が登場している。ロボティクスと自動化を組み合わせて、高スループットの実験を実現するセルフドライビングラボ(SDL)である。これには、退屈で遅い手作業を置き換えるために、データを分析し、次の実験を設計するためのLLMも含まれる。

ソース:Ark Research
この新しい薬剤発見方法のリーダーは、Recursion Pharmaceuticals (RXRX )(以下で詳しく説明)である。
投資の洞察
AIとマルチオミクスの交差点で革新を起こしている多くの企業があるが、いくつかの企業は重要性や野心によって際立っている。
Recursion Pharmaceuticals
(RXRX )
Recursionは、AIを使用して新薬の発見を加速することに重点を置いた企業である。そうするために、以下を組み合わせて使用する。
- 170万個の小分子ライブラリ。
- 細胞培養、CRISPR遺伝子編集、可溶性因子、生ウイルスなど。
- 実験を週に最大220万回実行できる自動化されたロボット工学ワークフロー。
- 高スループット顕微鏡とシーケンシングシステム。
- カメラからの連続ビデオフィード。動物の挙動を包括的に測定する。
- 21ペタバイトを超える独自の高次元データを生成した、高度な計算リソース。
- ADMET(吸収、分布、代謝、排泄、毒性)データ。
Recursionは、薬剤発見用に世界で最も速いスーパーコンピューターを所有している。また、LLMとAIを訓練するために、20億以上の画像と、遺伝子と化合物のすべての可能な組み合わせの6兆の関係を推論した。

ソース:Ark Research
2024年8月、RecursionはExscientiaと合併した。Exscientiaは、精密治療に重点を置き、”実験サイクル全体にわたる包括的なロボット自動化“を使用している企業である。Recursionはまた、2023年5月に薬物化学に焦点を当てた前臨床スタートアップのCyclicaとValanceを8,750万ドルで買収した。
これらの新しく取得した企業がRecursionのコアデータセットと統合されると、会社は完全に統合されたバイオテック企業となり、ターゲットの特定、インシリコ予測、インビボ検証、臨床試験のすべてを処理できるようになる。

ソース:Recursion
Recursionには、臨床開発のさまざまな段階で20以上の分子があり、そのうち7つはがんや希少疾患の臨床試験第1/2相にある。
これらのプログラムには、最大200億ドルの研究開発マイルストーンの支払いが含まれる10を超えるパートナーシップがあり、そのうち4.5億ドルがすでに支払われている。
全体として、新しいRecursionは、買収とAIを使用した薬剤発見への早期参入によって成長し、大手製薬企業がR&Dパイプラインを補充しようとする中で、重要なパートナーになる可能性が高い。
Illumina
他のオミクスは重要ですが、ほとんどが、すべての細胞の「指示書」の中心であるゲノミクスを中心に機能しています。
ゲノムシーケンシングマシンの最大の製造元は、Illuminaです。会社は、がん検出に使用される短い遺伝子シーケンスの読み取りに重点を置いています。165カ国に22,000以上のシーケンサーが設置されています。
Illuminaのシーケンシングマシンの消耗品の約半分は臨床応用で使用され、残りの半分は公的および私的研究ラボで使用されます。臨床応用では、需要の半分ががんから来ています。

ソース:Illumina
マルチオミクスとゲノミクスが薬剤発見プロセスおよびがん診断の中心になると、Illuminaの機器が高く需要されることになる。会社は、臨床応用では18%のCAGR、研究では6%のCAGRで、NGS(次世代シーケンシング)の需要が成長すると予測しています。これにより、2033年までに臨床の総アドレス可能市場(TAM)は1000億ドル、研究は250億ドルに達すると予想しています。

ソース:Illumina
Illuminaは、液体生検会社Grail (GRAL )と複雑な歴史を持っている。
これらの問題が解決されると、Illuminaは長期的な成長と株価上昇を再開する可能性が高く、最終的にはGrailの液体生検検査はIlluminaのシーケンサーに依存することになるからである。
Ginkgo Bioworks
マルチオミクスに焦点を当てたほとんどの企業は、がんや希少疾患の治療などのブロックバスター薬の潜在的な利益性により、製薬/バイオテック分野に存在している。
しかし、これは、生物システムの化学製品、農業、材料、バイオ燃料など、数えきれないほどの他の用途における驚くべき潜在を無視することになる。
これが、Ginkgo Bioworksの焦点である。Ginkgoは、「需要に応じて生物を構築する」ための革新的なモデルを構築し、合成生物学の分野でリーダーとなっている(「Top 5 Synthetic Biology Public Companies」を参照)。
この方法で、Ginkgoは、単にツールの販売から、解決策の提供、フルパートナーシップまで、さまざまなレベルの協力を行うことができる。
Ginkgoのさまざまな研究プログラムやパートナーシップには、以下のようなものがある。
- カンナビノイド
- mRNAワクチン製造および核酸医薬品
- 食品タンパク質
- バイエルとの生物肥料製造のパートナーシップ
- 腸疾患のためのプログラム可能な微生物
- マイクロプラスチックの生物学的除去
- バイオセキュリティと病原体検出
- 廃棄物と汚染物質のリサイクル
Ginkgoの専門知識は、過去数年間に協力した多様なクライアントやパートナーによって実証されている。世界的な工業および農業企業から、リーディング製薬企業までである。

ソース:Ginkgo Bioworks
会社の研究ハードウェアは、Reconfigurable Automation Carts(RACs)を中心に構築されており、これらは、高生物学的データ生成のためのモジュールを形成し、完全な研究ラボに統合できる。
Ginkgoは、2024年に事業モデルの見直しを迫られました。これは、拡大と地理的な場所が多すぎたためです。これにより、会社は、主にオーバーヘッドコストを半分に減らして、営業費用(Opex)を1億5150万ドルから1億3750万ドルに削減することができました。
これにより、会社は収益性に近づき、研究契約とその支払いマイルストーンの進展にも近づくことになる。
課題
プライバシー
マルチオミクス分析と個別化医療の時代が近づいているが、これには課題も伴う。最初の課題は、データプライバシーの問題であり、特にデータが私たちのデジタル生活ではなく、私たちの身体そのものである場合に、特にデリケートな問題となる。
データのセキュリティが良好であり、承認された人員のみがアクセスでき、データが匿名化され、医療や保険を拒否するために使用されないことが、人々がこの技術革命を受け入れるために不可欠であることは明らかである。
また、普遍的に収集された遺伝子データ、特にそれが医療専門家以外の人々(たとえば警察や国家機関のメンバー)によってアクセスされる場合の懸念もある。
規制
生物学的データの機密性のため、規制の強化が予想される。これは、まずプライバシーの問題を包含するが、以下のような他のトピックも包含する。
- データの多さにより、1つまたは数社がすべての生物学的データを支配する独占が生じるリスク。
- 個人のリスクと人口全体のリスクのバランスを管理すること、および差別や不公平な商慣行を回避すること。
- 富に関係なく、個別化医療の公平な扱いを管理すること、および潜在的な集団コストを管理すること。
アクセシビリティ
個別化医療とマルチオミクスデータは非常に複雑であるため、非専門家や医師に説明することが難しい。プライバシーと公平性の懸念と組み合わせると、抵抗や逆効果が発生する可能性がある。
同様に、mRNAワクチンの大規模接種に対する政策が、COVID-19に対する政治化されたように、多様なオミクスとAI駆動の医療に対して政治化される可能性がある。
また、このような技術は、初期段階では、高価になる可能性があり、富の不平等が生物学的および医療の分断になることを避けることが重要である。
AI駆動のヘルスケアの未来
医療データの増加、強力なAI、自動化された生物学的研究所、インシリコでのタンパク質やさらには全細胞のシミュレーションなどが、医療と医療研究のまったく新しい分野を生み出している。
これは、おそらく始まりに過ぎない。さらに多くの進歩が、革新をさらに速めるために積み重なっている。
- より優れたAI、オープンソースのDeepSeekの計算の急激な改善を含む。また、AlphaFoldやOpenCRISPR-1も同様である。
- 計算能力の向上、量子コンピューティングがタンパク質の3D構造の解決などの問題を解決するための強力なツールとなる可能性がある。
- より優れた分析ツール、次世代シーケンシング(NGS)から空間生物学まで。
- より正確で安全な遺伝子操作ツール、CRISPR、指向性進化、および合成およびプログラム可能な生物学を含む。
- マルチオミクス分析の新しい用途が、液体生検やがんの早期発見などの経済的利益を生み出す。
最終的には、近い将来、ほとんどの医療は、遺伝子、代謝、微生物群、ゲノムに合わせてカスタマイズされる可能性がある。年1回の検査でがんを完璧に検出できるようになり、代謝、微生物群、ゲノムの完全なバランスによって、より健康で元気な生活を送ることができるようになる。
投資の観点から、AI-バイオテックレースの主な勝者は、巨大な生物学的データセットを作成する能力を持つ企業である可能性が高い。独自のアルゴリズムや計算パワーを持っているのではなく、AI技術は非常に速いペースで進化しており、超大規模なデータセンターによる持続可能な利点は、分散型オープンソースモデルに向かって進化している。













