主題
- #自律走行
- #生命科学
- #AI
- #新薬開発
- #データ
作成: 2024-11-08
更新: 2024-11-08
作成: 2024-11-08 09:47
更新: 2024-11-08 09:51
長年の待ちに待った末、ついに自動運転車が誕生しました。野心的な初期目標や高ぶった人々の期待全てが満たされたわけではありませんが、それでも相当な進歩がありました。
完全自動運転車や部分自動運転車は、今や人工知能(AI)における最も成熟した技術の一つです。今日のサンフランシスコでは、携帯電話でウェイモを呼び出すと、数分後には回転センサーで覆われた白いジャガーI-Paceが、運転席が空の状態で静かにやってきます。また、車線維持支援など、一般車両の運転支援機能も、ますます急速に進化しています。
自動運転産業が成熟するにつれ、ライフサイエンスを含む他のAI応用分野へと、興味と才能を持った人材が継続的に流入しており、この人材流入がライフサイエンスの発展に道標となり得ると信じています。ライフサイエンス分野におけるAIも、人々の期待感が高まった後、漸進的な成功が積み重ねられ、業界を再定義する過程を経ることになるでしょう。
こうした内容を踏まえ、自動運転業界から得られた4つの教訓を、新薬の発見と開発のためのAIにも適用できると考えます。
特定のドメイン内で基礎データとモデルが改善されるにつれ、より多くの意思決定が、説明可能な人間定義アルゴリズムから「ブラックボックス」モデルへと移行しています。これは自動運転ソフトウェア開発においても見られるものであり、業界では、車両周辺のシーンに関する学習済み表現と、スタックのより多くの機能を制御する学習モデルを徐々に採用しています。
例えば、駐車しているかどうかを識別するアルゴリズムをハードコーディングする代わりに(自動運転車との相対速度に基づいて)、モデルは、駐車車両の全てのラベル付けされた学習データに基づいて、その車両の状態を予測することができます。
自動運転業界は、厳密に定義された要件に基づく開発から、車両の動作領域を統計的に表現し、探索できる複雑で高次元な空間としてモデル化する方式へと転換しました。これにより性能は向上しましたが、解釈可能性は徐々に低下しました。
私たちは、ライフサイエンスにも同様の変化が訪れていると信じています。生物学の複雑さと多様性(病気や人口集団間の複雑な相互作用を含む)は、人間が理解できる概念の表現よりもはるかに多くの情報を包含しています。この複雑性を意思決定に反映させるため、製薬業界は、従来の単純化されたデータ表現から高次元データ表現方式への転換を遂げるでしょう。
例えば、「どの患者集団が私の新薬候補から最も大きな恩恵を受ける可能性が高いのか?」といった重要な問いは、直感やヒューリスティックに基づく決定ではなく、データに基づいた意思決定へと転換されるでしょう。そして、そうした問いに答えるためのアルゴリズムは、複雑な高次元データ表現に依存することになるでしょう。
自動運転業界は、内部で収集した限られたデータを利用した学習方式から脱却し、車両学習モデルへと転換しています。現実環境で顧客車両が走行しながら収集したデータに基づいて、モデルを継続的に改善しています。顧客車両から収集されたデータは、今や自動運転に向けた競争において、自動車メーカーが保有する最も重要な資産の一つとなっています。大規模データエンジンによる自動化されたデータ収集は、車両が展開される複雑な領域に対する理解を構築するために必要な多様なデータを収集できる唯一の方法です。
ライフサイエンス分野でも、同様のダイナミクスが発生すると予想されます。この「リアルタイムデータ収集」は、発見、開発、臨床試験の全段階にわたって行われます。
自動化データエンジンは、医薬品開発段階全体で収集したデータを使用して、製品とプロセスを自動的に改善します。
成功のためには、データを繰り返し大量に収集する必要があります。それぞれの試験や処方は、将来の開発のためにさらに多くのデータを収集できる機会となります。つまり、各段階で収集されたデータは、新薬の発見と開発のあらゆる段階を改善するために使用されるべきです。
ライフサイエンス分野の規制と安全要件、および生物学的データの異質性により、このデータエンジンは自動運転とは見た目こそ異なるものの、データ収集と製品開発間の深く自動化された統合という根本的な目標は同じです。成功した企業であれば、新しく収集されたデータに基づいて、将来の製品の反復が自動的に改善される様子を目にすることになるでしょう。
自動運転の成功は、計画よりも長くかかりました。勝者は、10年以上開発に多大な投資を行うことができる立場にありました。ライフサイエンス向けのAIも同様です。現在の熱い関心は、この分野に人材と資本が流入する未来志向的な思考の機会です。しかし、勝者は、ほとんど即効性のない長期的な努力を計画する人になるでしょう。
つまり、長期的な努力が必要だということです。この旅に必要な資金を支援してくれる投資家、パートナー、または顧客はいますか?データエンジンがプラットフォームとして構築されている間に、何度も臨床試験の失敗を乗り越えることができるでしょうか?
自動運転は完璧ではありませんが、自動化レベルを分類するのに役立つ分類法を使用しています。SAEの自動運転レベルは、自動化システムをレベル0(自動化なし)、レベル2(部分運転自動化)、レベル5(完全運転自動化)を含む6段階に分類しています。
運転支援と完全自動運転は、それぞれ異なるアプローチと投資が必要です。そのため、全ての自動運転プログラムは、開発中の自動化レベルに応じて、要件と計画が異なります。SAEの自動運転分類は、これを簡潔に表現する際に使用されるものです。
プログラムごとに自動化目標が異なるのは、ライフサイエンス分野でも同じです。パイプラインのどの部分を自動化するのか?一部の企業は、発見過程のごく一部、例えばインシリコスクリーニングのみを自動化し、スタックの残りの部分には従来の新薬開発方法論を採用するでしょう。他の企業は、完全に自律的で反復的な新薬発見と開発を目標に、プラットフォームの構築を目指すでしょう。
異なるアプローチは、それぞれ異なる構造、ツール、資本構造を必要とします。自動化レベルに関する定義は、業界が「AI導入」という一般的な目標を超えて、共通言語とロードマップを持つことができるようにするでしょう。
今後の道のりは長く険しいでしょう。多くの失敗があるでしょうが、成功はライフサイエンスの可能性を再定義するでしょう。
https://www.convoke.bio/from-self-driving?utm_source=substack&utm_medium=email
コメント0