主题
- #AI
- #自動駕駛
- #新藥開發
- #生命科學
- #數據
撰写: 2024-11-08
更新: 2024-11-08
撰写: 2024-11-08 09:47
更新: 2024-11-08 09:51
經過數年等待,自動駕駛車輛終於問世。雖然雄心勃勃的初始目標和人們過高的期待並非完全實現,但仍取得了相當大的進展。
全自動駕駛和部分自動駕駛車輛現已成為人工智慧(AI)最成熟的技術之一。如今,在三藩市,您可以透過手機叫車Waymo,幾分鐘後,一輛覆蓋旋轉感測器的白色捷豹I-Pace將悄然駛來,駕駛座空無一人。此外,一般車輛的輔助駕駛功能(例如自動車道維持)也持續快速發展。
隨著自動駕駛產業的成熟,越來越多的具有豐富經驗和才能的人才持續轉向其他AI應用領域,包括生命科學,我們相信這些人才的湧入將有助於生命科學的發展。生命科學領域的AI也將經歷一段從人們高度期待到逐步累積成功,最終重新定義整個產業的過程。
基於以上內容,我們認為可以將自動駕駛行業的四個經驗教訓應用於AI在新藥發現和開發中的應用。
隨著特定領域內基礎數據和模型的改進,越來越多的決策從可解釋的人工定義演算法轉向“黑盒”模型。這在自動駕駛軟體開發中也有體現,該行業正在逐步採用針對車輛周圍場景的學習表示以及控制更多堆疊功能的學習模型。
例如,與其編寫識別車輛是否停放的演算法(基於與自動駕駛車輛的相對速度),不如讓模型根據所有已標記的停放車輛的訓練數據來預測車輛的狀態。
自動駕駛行業已從基於嚴格定義的需求的開發轉變為一種方法,該方法將車輛的操作區域建模為一個複雜且高維度的空間,可以統計地表示和探索該空間。這提高了效能,但也降低了解釋性。
我們相信生命科學領域也將出現類似的變化。生物學的複雜性和多樣性(包括疾病和人群之間複雜的相互作用)包含的信息遠遠超出人類可以理解的概念表示。為將這種複雜性納入決策中,製藥行業將從傳統的簡化數據表示轉向高維數據表示方法。
例如,“哪些患者群體最有可能從我的新藥候選藥物中受益?”這樣的關鍵問題將從基於直覺或啟發式的決策轉變為基於數據的決策。而用於回答這些問題的演算法將依賴於複雜的高維數據表示。
自動駕駛行業正在從使用有限的內部收集數據進行訓練轉向使用車輛訓練模型。他們基於客戶車輛在現實環境中駕駛時收集的數據持續改進模型。從客戶車輛收集的數據現在已成為汽車製造商在自動駕駛競爭中最重要的資產之一。透過大型數據引擎進行自動化數據收集是收集構建對車輛部署的複雜領域的理解所需的各種數據的唯一方法。
我們預計生命科學領域也會出現相同的動態。這種“實時數據收集”將貫穿發現、開發和臨床階段:
自動化數據引擎會利用在藥物開發的各個階段收集的數據來自動改進產品和流程。
為了取得成功,需要重複收集大量數據。每一次實驗和處方都將成為收集更多數據以供未來開發的機會。也就是說,每個階段收集的數據都應被用於改進新藥發現和開發的各個階段。
由於生命科學領域的監管和安全要求以及生物數據的異質性,這個數據引擎在表面上可能與自動駕駛不同,但其根本目標是一樣的:在數據收集和產品開發之間建立深層次的自動化整合。成功的公司將看到基於新收集的數據對未來產品的迭代進行自動改進。
自動駕駛的成功比預期時間更長。贏家們處於可以長期投入大量資金進行開發的地位。生命科學的AI也是如此。目前的熱潮是未來導向思維的機會,它將人才和資本吸引到這個領域。然而,贏家將是那些計劃長期努力,即使短期內成果甚微的人。
也就是說,這需要長期的努力。是否有投資者、合作夥伴或客戶來資助這段旅程?在數據引擎被建造成平台的過程中,是否能夠承受多次臨床試驗失敗?
自動駕駛雖然並不完美,但它使用了一個有用的分類法來對自動化水平進行分類。SAE的自動駕駛等級將自動化系統分為六個級別,包括0級(無自動化)、2級(部分駕駛自動化)和5級(完全駕駛自動化)。
駕駛輔助和全自動駕駛需要不同的方法和投資。因此,每個自動駕駛項目根據其開發的自動化水平而有不同的需求和計劃。SAE的自動駕駛分類法在簡潔地表達這一點時非常有用。
每個項目都有不同的自動化目標,生命科學領域也是如此。應該自動化管道中的哪些部分?一些公司只會自動化發現過程的一小部分,例如體外篩選,而其餘的堆疊則採用傳統的新藥開發方法。其他公司將目標設定為構建一個平台,旨在實現完全自主和迭代的新藥發現和開發。
不同的方法需要不同的架構、工具和資本結構。對自動化水平的定義將使該行業能夠超越“採用AI”這個共同目標,擁有共同的語言和路線圖。
未來的旅程將漫長而艱辛。將會有許多失敗,但成功將重新定義生命科學的可能性。
https://www.convoke.bio/from-self-driving?utm_source=substack&utm_medium=email
评论0