이 글의 원문링크
주제
- #AI
- #생명과학
- #데이터
- #자율주행
- #신약개발
작성: 2024-11-08
업데이트: 2024-11-08
작성: 2024-11-08 09:47
업데이트: 2024-11-08 09:51
수년간의 기다림 끝에 이제는 자율 주행 차량이 등장했습니다. 야심찬 처음 목표와 부풀었던 사람들의 기대가 모두 충족되지는 않았지만, 그래도 상당한 진전이 있었습니다.
완전 자율주행 및 부분 자율주행 차량은 이제 인공지능(AI)의 가장 성숙한 기술 중 하나입니다. 오늘날 샌프란시스코에서 휴대폰으로 Waymo를 호출하면 몇 분 후 회전 센서로 덮인 흰색 재규어 I-Pace가 운전석이 비어 있는 상태로 조용히 찾아 옵니다. 또한 자동 차선 유지와 같은 일반 차량의 보조 주행 기능 또한 계속해서 빠른 속도로 발전하고 있습니다.
자율주행 산업이 성숙해짐에 따라 생명과학을 비롯한 다른 AI 응용 분야로 흥미와 재능을 가진 인재들이 지속적으로 이동하고 있으며 이러한 인재들의 유입이 생명과학의 발전에 길잡이 역할을 할 수 있다고 믿습니다. 생명과학 분야의 AI도 사람들의 기대감이 한껏 부풀어 오른 후 점진적인 성공이 축적되어 업계를 재정의하는 과정을 거치게 될 것입니다.
이런 내용을 바탕으로 자율 주행 업계에서 얻은 네 가지 교훈을 신약 발견 및 개발을 위한 AI에도 적용할 수 있다고 생각합니다.
특정 도메인 내에서 기본 데이터와 모델이 개선됨에 따라 더 많은 의사 결정이 설명 가능한 인간 정의 알고리즘에서 '블랙박스' 모델로 이동하고 있습니다. 이는 자율 주행 소프트웨어 개발에서도 나타나고 있는데, 업계에서는 차량 주변 장면에 대한 학습된 표현과 스택의 더 많은 기능을 제어하는 학습 모델을 점차적으로 채택하고 있습니다.
예를 들어, 자동차의 주차 여부를 식별하는 알고리즘을 하드코딩하는 대신(자율주행 차량과의 상대 속도를 기준으로), 모델은 주차된 차량의 모든 라벨링된 학습 데이터를 기반으로 해당 차량의 상태를 예측할 수 있습니다.
자율 주행 산업은 엄격하게 정의된 요구 사항 기반 개발에서 차량의 작동 영역을 통계적으로 표현하고 탐색할 수 있는 복잡하고 큰 차원의 공간으로 모델링하는 방식으로 전환했습니다. 이로 인해 성능은 향상되었지만 해석 가능성은 점차 낮아졌습니다.
저희는 생명과학에도 동일한 변화가 다가오고 있다고 믿습니다. 생물학의 복잡성과 다양성(질병과 인구 집단 간의 복잡한 상호작용 포함)은 인간이 이해할 수 있는 개념의 표현 보다 훨씬 더 많은 정보를 담고 있습니다. 이런 복잡성을 의사 결정에 반영하기 위해 제약 업계는 기존의 단순화된 데이터 표현에서 고차원의 데이터 표현 방식으로 전환될 것입니다.
예를 들어 “어떤 환자 집단이 내 신약 후보물질로부터 가장 큰 혜택을 받을 가능성이 높은가?"와 같은 중요한 질문은 직관이나 휴리스틱 기반의 결정이 아닌 데이터 기반 의사 결정으로 전환될 것입니다. 그리고 그런 질문에 답하기 위한 알고리즘은 복잡한 고차원의 데이터 표현에 의존하게 될 것입니다.
자율주행 업계는 내부에서 수집한 제한된 데이터를 이용한 학습 방식에서 벗어나 차량 학습 모델로 전환하고 있습니다. 실제 환경에서 고객 차량이 주행하면서 수집한 데이터를 기반으로 모델을 지속적으로 개선하고 있습니다. 고객 차량에서 수집된 데이터는 이제 자율주행을 향한 경쟁에서 자동차 제조업체가 보유한 가장 중요한 자산 중 하나입니다. 대규모 데이터 엔진을 통한 자동화된 데이터 수집은 차량이 배치되는 복잡한 영역에 대한 이해를 구축하는 데 필요한 다양한 데이터를 수집할 수 있는 유일한 방법입니다.
생명과학 분야에서도 동일한 역학 관계가 발생할 것으로 예상됩니다. 이러한 '실시간 데이터 수집'은 발견, 개발 및 임상 단계 전반에 걸쳐 이루어질 것입니다:
자동화 데이터 엔진은 의약품 개발 단계 전반에서 수집한 데이터로 제품과 프로세스를 자동으로 향상시킵니다.
성공을 위해서는 데이터를 반복해서 많이 수집해야 합니다. 각각의 실험 및 처방은 향후 개발을 위해 더 많은 데이터를 수집할 수 있는 기회가 될 것입니다. 즉, 단계마다 수집된 데이터는 신약 발견 및 개발의 모든 단계를 개선하는 데 사용되어야 합니다.
생명과학 분야의 규제 및 안전 요건과 생물학적 데이터의 이질성으로 인해 이 데이터 엔진은 자율 주행과 겉모습은 다르겠지만 데이터 수집과 제품 개발 간의 심층적이고 자동화된 통합이라는 근본적인 목표는 동일합니다. 성공적인 기업이라면 새로 수집된 데이터를 기반으로 향후 제품의 반복이 자동으로 개선되는 것을 보게 될 것입니다.
자율 주행의 성공은 계획보다 오래 걸렸습니다. 승자들은 10년 이상 개발에 막대한 투자를 할 수 있는 위치에 있었습니다. 생명과학용 AI도 마찬가지입니다. 현재의 뜨거운 관심은 이 분야에 인재와 자본이 유입되는 미래지향적인 사고의 기회입니다. 그러나 승자는 즉각적인 성과는 거의 없이 장기적인 노력을 계획하는 사람이 될 것입니다.
즉, 장기적인 노력이 필요하다는 뜻입니다. 이 여정에 필요한 자금을 지원할 투자자, 파트너 또는 고객이 있는지? 데이터 엔진이 플랫폼으로 구축되는 동안 여러 번의 임상 실패를 견뎌 낼 수 있을까요?
자율 주행은 완벽하지는 않지만 자율 수준을 분류하는 데 유용한 분류법을 사용합니다. SAE의 자율주행 수준은 자동화 시스템을 레벨 0(자동화 없음), 레벨 2(부분 주행 자동화), 레벨 5(완전 주행 자동화)를 포함한 6단계로 분류합니다.
주행보조와 완전 자율주행은 서로 다른 접근 방식과 투자가 필요합니다. 따라서 모든 자율 주행 프로그램은 개발 중인 자동화 수준에 따라 요구 사항과 계획이 다릅니다. SAE의 자율주행 분류는 이를 간결하게 표현할 때 사용되는 것입니다.
프로그램마다 자동화 목표가 다른 것은 생명 과학 분야에서도 마찬가지입니다. 파이프라인의 어떤 부분을 자동화할 것인가? 일부 회사는 발견 과정의 작은 부분, 예를 들어 인실리코 스크리닝만 자동화하고 나머지 스택에는 전통적인 신약 개발 방법론을 채택할 것입니다. 다른 기업들은 완전히 자율적이고 반복적인 신약 발굴 및 개발을 목표로 플랫폼을 구축하는 것을 목표로 할 것입니다.
서로 다른 접근 방식은 서로 다른 구조, 도구, 자본 구조를 필요로 할 것입니다. 자율성 수준에 대한 정의는 업계가 'AI 도입'이라는 일반적인 목표를 넘어 공유 언어와 로드맵을 가질 수 있게 해줄 것입니다.
앞으로의 여정은 길고 험난할 것입니다. 많은 실패가 있겠지만, 성공은 생명과학의 가능성을 재정의할 것입니다.
https://www.convoke.bio/from-self-driving?utm_source=substack&utm_medium=email
댓글0