Categories
과학탐구 생명과학 통합과학

인공지능을 이용한 단백질 설계와 이를 통한 단백질 신약 개발의 성공 가능성 분석

I. 요약

인공지능(AI) 기반 단백질 설계는 전통적인 신약 개발 방식이 직면한 막대한 비용, 긴 개발 기간, 낮은 성공률이라는 고질적인 문제를 해결하며 제약 산업의 패러다임을 혁신하고 있습니다. AI는 유용한 기능을 가진 단백질을 컴퓨터 내에서 인공적으로 설계하고 합성할 수 있도록 함으로써, 기존 실험 방식으로는 불가능했던 새로운 신약 개발의 가능성을 열었습니다.1

본 보고서는 AI 기반 단백질 설계의 기본 개념부터 신약 개발 전 과정에 걸친 전략적 활용, 현재까지의 성공 사례, 그리고 여전히 극복해야 할 과제와 한계점을 심층적으로 분석합니다. 또한, 미래 성공을 위한 핵심 요인과 전반적인 시장 전망을 제시하여, 제약 및 바이오 산업의 의사결정자들이 AI 기술의 잠재력을 최대한 활용할 수 있도록 균형 잡힌 관점을 제공합니다.

현재 AI가 설계한 약물 후보 물질들은 임상 초기 단계에서 전통적인 방식보다 훨씬 높은 성공률을 보이며, 전임상 단계의 기간을 획기적으로 단축하는 등 가시적인 성과를 내고 있습니다. 이는 AI가 단순히 개발 속도를 높이는 것을 넘어, 신약 개발 과정의 위험을 줄이는 핵심 기술로 자리매김하고 있음을 시사합니다. 그러나 데이터의 양과 질, AI 모델의 투명성, 규제 및 윤리적 문제, 그리고 전임상 결과의 인체 적용 가능성 등은 여전히 해결해야 할 중요한 과제로 남아 있습니다.

궁극적으로 AI 기반 단백질 설계는 신약 개발의 효율성과 성공률을 높여 환자들에게 더 빠르고 효과적인 치료법을 제공할 수 있는 혁신적인 잠재력을 가지고 있습니다. 이러한 잠재력을 현실화하기 위해서는 기술적 발전과 더불어 데이터 인프라 구축, 학제 간 협력, 그리고 적응력 있는 규제 프레임워크 마련이 필수적입니다.

II. 서론: 인공지능으로 신약 개발의 판도를 바꾸다

전통적인 신약 개발의 고질적인 문제점

신약 개발은 복잡하고 시간이 많이 소요되는 과정으로, 평균 10년에서 15년의 기간과 1조 원에서 2조 원 이상의 막대한 비용이 소요됩니다.2 이러한 투자에도 불구하고, 약 1만 개의 후보 물질 중 1개 미만이 신약으로 최종 출시되며, 임상 시험 성공률은 약 7.9%에 불과합니다.2 이러한 현상은 투자 대비 신약 승인 수가 감소하는 ‘이룸의 법칙(Eroom’s Law)’으로 설명되기도 합니다.3 많은 약물 후보 물질들이 임상 개발 단계에서 효능 부족, 안전성 문제 또는 제조상의 어려움으로 인해 실패합니다.4 최근 임상 초기 단계 약물의 승인 가능성은 6% 미만으로 떨어졌다가 10~11%로 회복되었지만, 여전히 이상적인 수준에는 훨씬 못 미칩니다.4

AI 기반 단백질 설계의 정의 및 핵심 역할

AI 기반 인공 단백질 설계는 컴퓨터 프로그램 내에서 유용한 기능을 보유한 단백질을 인공적으로 설계하고 실제 합성할 수 있도록 하는 혁신적인 기술입니다.1 이 기술은 기존의 실험 방식으로는 불가능했던 단백질의 인공적인 설계를 가능하게 함으로써 신약 개발의 새로운 지평을 열었습니다.1 AI 기술의 적용은 질병 표적 식별부터 신약 개발, 전임상 및 임상 연구, 시판 후 안전 관리까지 신약 개발의 전 과정에 걸쳐 확대되고 있습니다.2

AI는 방대한 임상 데이터와 최적화된 AI 알고리즘을 활용하여 개발 기간과 비용을 획기적으로 절감할 수 있는 장점을 제공합니다.2 실제로 일부 AI 중심 스타트업은 전임상 시험 기간을 기존 3~6년에서 30개월로 단축하는 성과를 보여주었습니다.12 AI 기반 de novo 단백질 설계는 단순히 기존 단백질의 구조를 예측하는 것을 넘어, 자연에 존재하지 않는 완전히 새로운 단백질을 처음부터 설계하는 패러다임의 전환을 의미합니다. 이는 자연적인 진화 과정에서 발생할 수 있는 불완전성이나 타협점으로부터 자유로운, 현대 의학의 요구에 최적화된 합성 단백질을 생성할 수 있는 성능 우위를 제공합니다.14

이러한 기술적 진보는 AI가 신약 개발의 단순한 가속화 도구를 넘어, 과정 자체의 위험 요소를 근본적으로 줄이는 핵심 기술로 부상하고 있음을 보여줍니다. 전통적인 신약 개발은 ‘이룸의 법칙’이 지배하는, 비용이 계속 증가하고 성공률은 떨어지는 경향을 보여왔습니다.3 그러나 AI는 개발 과정의 비효율성을 해소하고 7, 비용과 시간을 크게 절감할 수 있는 잠재력을 제공합니다.11 de novo 설계 및 in silico 최적화 능력 14은 잠재적인 실패 요인들을 초기 단계에서 식별하고 완화할 수 있게 합니다. 이는 막대한 재정적, 시간적 투자가 이루어지기 전에 실험실 연구나 임상 시험에서 발생할 수 있는 실패를 미리 걸러내는 효과를 가져옵니다. 이러한 변화는 AI의 역할을 단순한 ‘가속화’에서 신약 개발 생애 주기 전반에 걸친 핵심적인 ‘위험 완화’ 기술로 전환시키고 있습니다. 결과적으로, AI의 가치 제안은 단순한 효율성 증대를 넘어, 신약 개발의 위험 프로필을 근본적으로 변화시킵니다. 이러한 변화는 과거에는 실현 불가능하다고 여겨졌던 목표나 ‘난공불락(undruggable)’으로 간주되던 표적들을 실현 가능한 대상으로 만들 수 있으며, 성공 가능성(PoS)을 크게 향상시킬 수 있습니다.4 이러한 변화는 제약 파이프라인의 다양성을 촉진하고, 기업들이 위험이 낮다고 인식되는 유사한 표적에 집중하는 현재의 ‘무리 짓기(herding)’ 경향에서 벗어나 진정한 혁신을 추구할 수 있도록 유도할 수 있습니다.15

보고서의 범위 및 목적

본 보고서는 AI 기반 단백질 설계 및 단백질 신약 개발 적용의 성공 가능성을 심층적으로 분석하는 것을 목표로 합니다. 이를 위해 기본 개념, 신약 개발 파이프라인 전반에 걸친 전략적 통합, 현재까지의 성공 사례, 내재된 도전 과제, 미래 성공을 위한 핵심 요소, 그리고 전반적인 시장 전망을 다룰 것입니다.

III. AI 기반 단백질 설계의 기본 원리

단백질에 대한 이해

단백질은 20가지 종류의 아미노산으로 구성된 복잡한 거대 분자입니다.16 이들은 생체 내 거의 모든 생물학적 과정에 필수적이며, 구조 단백질, 효소, 호르몬, 운반 단백질, 항체 등 다양한 기능을 수행합니다.16 단백질의 특정 생물학적 기능은 아미노산의 선형 서열에 의해 정확하게 결정되는 고유한 3차원(3D) 구조와 밀접하게 관련되어 있습니다.16 이러한 근본적인 관계는 종종 “단백질 공학의 중심 원리(central dogma of protein engineering)”라고 불립니다.17

단백질은 1차 구조(아미노산 서열), 2차 구조(알파-나선, 베타-병풍 등 국소적인 접힘 패턴), 3차 구조(전체적인 3D 형태), 그리고 4차 구조(여러 단백질 사슬의 배열)와 같은 계층적인 구조를 가집니다.16 단백질 설계는 새로운 단백질 분자를 합리적으로 설계하여 새로운 활성, 행동 또는 목적을 부여하고 단백질 기능에 대한 기본적인 이해를 증진하는 과정입니다.19 이는 주로 원하는 3D 구조로 안정적으로 접힐 아미노산 서열을 예측하는 것을 목표로 합니다.19

가능한 단백질 서열의 수는 단백질 크기에 따라 기하급수적으로 증가하여, 예를 들어 30개의 아미노산으로 구성된 작은 단백질이라도 1.07 x 10^39가지의 다른 조합이 가능합니다.20 이러한 천문학적인 경우의 수는 철저한 실험적 탐색을 사실상 불가능하게 만듭니다. 또한, 단백질은 생체 내에서 고정된 정적 구조가 아니라 유연하게 움직이는 동적인 존재라는 점을 고려해야 하며, 이러한 유연성은 효과적인 약물 설계에서 반드시 고려되어야 할 중요한 요소입니다.21

AI 기반 단백질 설계의 핵심 원리

AI 기반 단백질 설계는 유용한 기능을 가진 단백질을 컴퓨터 환경에서 인공적으로 생성하고 실제 합성 가능하도록 하는 기술입니다.1 목표는 선택된 표적 구조를 가장 낮은 자유 에너지 상태로 갖는 서열을 식별하는 것입니다.19 이 과정은 AI 알고리즘이 미리 정의된 점수 기준에 따라 가장 적합한 서열을 선택하여 원하는 접힘을 달성하는 최적화 문제로 간주됩니다.19

AI 모델은 기존 단백질 구조와 기능에 대한 방대한 데이터를 학습하고 활용합니다.16 이러한 데이터 중심 접근 방식은 일반적으로 데이터 수집 및 전처리, AI 모델 학습, 그리고 학습된 모델을 이용한 새로운 단백질 설계 및 검증의 세 가지 주요 단계로 이루어집니다.16

AI 기반 단백질 설계는 크게 두 가지 방식으로 나눌 수 있습니다:

  • De novo 설계 (De novo design): 자연에 존재하지 않는 완전히 새로운 단백질을 처음부터 창조하는 최첨단 접근 방식입니다. 이는 “예측에서 창조로”의 근본적인 전환을 의미합니다.14
  • 단백질 재설계 (Protein redesign): 알려진 단백질 구조와 서열을 계산적으로 변형하여 기존 기능을 변경하거나 향상시키는 데 중점을 둡니다.19

주요 AI 모델 및 알고리즘:

  • 단백질 구조 예측 (서열-구조 매핑): 이 모델들은 아미노산 서열로부터 3D 구조를 예측합니다.
  • AlphaFold (DeepMind): 단백질 구조 예측 분야에 혁명을 가져왔으며, 실험에 가까운 정확도를 달성했습니다.7 2024년 5월에 발표된 최신 버전인 AlphaFold 3는 단백질-리간드 상호작용 예측 능력을 50% 향상시키는 등 확장된 기능을 자랑합니다.27 AlphaFold의 개발자들(데미스 허사비스, 존 점퍼, 데이비드 베이커)은 이 획기적인 연구로 2024년 노벨 화학상을 수상했습니다.2
  • RoseTTAFold (데이비드 베이커 연구실): 또 다른 중요한 딥러닝 기반 구조 예측 네트워크로, 이 분야에 상당한 기여를 했습니다.31
  • ESMFold (Meta): 아미노산 서열로부터 단백질 구조를 정확하게 예측하는 단백질 언어 모델입니다.34
  • 이러한 예측 모델은 주어진 서열이 어떻게 접힐지 정확하게 예측함으로써 후보 설계를 필터링하는 데 매우 중요합니다.36 이는 비용이 많이 들고 비효율적이며 시간이 오래 걸리는 X선 결정학 같은 전통적인 실험 방법의 한계를 효과적으로 우회합니다.26
  • 역접힘 / 서열 설계 (구조-서열 매핑): 이 모델들은 주어진 3D 구조로 접힐 아미노산 서열을 설계합니다.
  • ProteinMPNN (데이비드 베이커 연구실): 3D 구조 정보를 효과적으로 처리하고 원하는 기능을 위해 맞춤화된 새로운 단백질 서열을 설계하는 메시지 패싱 신경망(MPNN)입니다.16 이는 단백질 안정성을 높이거나 새로운 기능을 부여하는 데 활용될 수 있습니다.16
  • Chroma: 대규모 언어 모델(LLM)을 기반으로 한 생성형 AI 모델로, 단백질의 기능과 구조를 동시에 고려하여 자연에 존재하지 않는 새로운 단백질을 창조할 수 있습니다.16
  • RFDiffusion (데이비드 베이커 연구실): 확산 모델(DALL-E가 노이즈에서 이미지를 생성하는 방식과 유사)을 사용하여 완전히 새로운 단백질 구조를 생성하는 생성 모델입니다. 이 접근 방식은 광범위한 실험 테스트의 필요성을 크게 줄여줍니다.27
  • ESM2 (Evolutionary Sequence Model 2): 단백질을 위해 특별히 사전 학습된 대규모 언어 모델(LLM)입니다. 단백질 서열을 고차원 벡터로 인코딩하여 복잡한 내부 표현과 진화 패턴을 포착합니다.38 ESM2는 다양한 단백질 특성과 돌연변이 효과를 정확하게 예측할 수 있습니다.38
  • 이러한 역접힘 및 생성 모델은 de novo 단백질 설계에 있어 가장 중요하며, 치료 응용을 위해 정밀하게 맞춤화된 특성을 가진 단백질 생성을 가능하게 합니다.14
  • 일반 생성형 AI 및 딥러닝 기술: 특정 단백질 모델 외에도, 생성형 AI는 최적화된 특성을 가진 새로운 분자 구조를 생성하는 데 널리 사용되며, 이는 단백질 서열과 해당 3D 구조를 모두 포함합니다.29 컨볼루션 신경망(CNN)은 단백질 잔기 간 거리 맵과 같은 그리드 구조 데이터를 분석하는 데 특히 효과적이며, 단백질 구조 예측, 백본 샘플링 및 서열 설계에 광범위하게 적용됩니다.22 딥 신경망(DNN) 및 강화 학습 알고리즘도 선도 물질 최적화 및 화합물 설계를 안내하는 데 점점 더 많이 활용되고 있습니다.34

AI 모델은 방대한 기존 단백질 구조 및 기능 데이터에 대해 학습하여 복잡한 패턴과 관계를 파악합니다.16 단백질 표현 학습을 위한 딥러닝 모델은 종종 사전 학습 방식을 사용합니다. 이 방식에서는 모델이 대량의 레이블 없는 데이터에 대해 초기 학습을 수행하여 견고한 숨겨진 표현을 추출합니다. 이렇게 사전 학습된 모델은 제한된 실험 레이블을 사용하여 특정 하위 작업을 위해 미세 조정될 수 있으며, 심지어 “제로 샷(zero-shot)” 예측도 수행할 수 있습니다.17 단백질 생성 모델은 구조적 또는 진화적 서열 맥락에 따라 아미노산에 대한 확률 분포를 학습하며, 이는 인상적인 비지도 예측 능력을 가능하게 합니다.38

이러한 기술적 발전은 AI 기반 단백질 설계 분야가 단순한 알고리즘 적용을 넘어 통합된 다중 모드 AI 시스템으로 진화하고 있음을 보여줍니다. AlphaFold의 노벨상 수상에 빛나는 구조 예측 정확도는 2 단백질 설계의 핵심적인 전제 조건입니다. 왜냐하면 원하는 표적 구조를 아는 것이 필수적이기 때문입니다.19 그리고 나서 생성 모델들은 이러한 구조적 이해를 바탕으로 새로운 서열을 창조합니다.14 SPURS 프레임워크는 ESM(단백질 언어 모델)과 ProteinMPNN(역접힘 모델)을 “재배선 전략(rewiring strategy)”을 통해 통합하여 단백질 안정성을 예측하는 방식으로 이러한 시너지를 명확히 보여줍니다. 이는 진화적 서열 패턴과 구조적 사전 지식을 효과적으로 결합하는 것입니다.38 이러한 접근 방식은 가장 영향력 있는 응용 분야가 단순히 AI를 사용하는 것을 넘어, 다양한 유형의 AI를 상호 보완적으로 전략적으로 결합하는 것임을 시사합니다. 이러한 총체적인 접근 방식은 종종 “AI-실험실 루프(AI-lab loop)” 27로 구현되며, 이는 단백질 설계의 엄청난 조합적 복잡성을 극복하고 20 더 높은 예측 정확도, 더 넓은 일반화 가능성, 그리고 궁극적으로 새로운 단백질 치료제의 발견 및 최적화를 가속화하는 데 결정적인 역할을 합니다.

또한, AI는 ‘약물 개발 가능한 프로테옴(Druggable Proteome)’의 확장을 가능하게 합니다. 전통적인 신약 개발은 역사적으로 효소, 이온 채널, 수용체와 같은 ‘약물 개발 가능한’ 단백질의 제한된 부분에 집중해 왔으며, 인간 프로테옴의 대다수는 미개척 상태로 남아 있었습니다.31 그러나 AI 기반 de novo 설계는 완전히 새로운 접힘을 가진 단백질을 생성하거나 19, GB-0669 단일클론 항체 사례에서 볼 수 있듯이, 이전에 ‘난공불락’으로 여겨졌던 특정 영역을 표적으로 삼을 수 있게 합니다.27 나아가 AI는 질병 표적에 대한 결합력 향상, 체내 분해 저항성 증가, 다양한 약물 전달 시스템과의 호환성 개선 등 최적화된 특성을 가진 새로운 단백질을 설계할 수 있습니다.14 이러한 능력은 자연 진화가 방대한 단백질 서열 공간의 극히 일부만을 탐색했다는 한계를 직접적으로 해결하며, AI가 ‘남아있는 광대한 공간’을 탐색할 수 있도록 합니다.22 이는 AI가 단순히 기존의 약물 개발 과정을 가속화하는 것을 넘어, 표적화하고 치료할 수 있는 대상의 범위를 근본적으로 확장하고 있음을 의미합니다. 이는 희귀 질환 16 및 기존 치료법으로는 효과를 보기 어려웠던 복합 질환에 대한 미충족 의료 수요를 해결하는 데 지대한 영향을 미칩니다. 새로운 표적을 발굴하고 미니단백질, 복합 펩타이드와 같은 새로운 치료 방식을 설계함으로써, AI는 진정으로 혁신적인 치료법의 길을 열고 있습니다.

IV. 단백질 신약 개발 파이프라인 전반에 걸친 AI의 전략적 통합

표적 식별 및 검증

AI는 방대한 고차원 멀티-오믹스 데이터(유전체학, 전사체학, 단백질체학 포함)와 복잡한 생물학적 네트워크를 효율적으로 분석함으로써 새로운 치료 표적을 식별하고 검증하는 과정을 획기적으로 가속화합니다.7 이는 새로운 종양 발생 취약점을 찾아내고 다양한 질병의 핵심 치료 표적을 식별하는 데 결정적인 역할을 합니다.7 AI 모델은 GDSC(Genomics of Drug Sensitivity in Cancer) 및 canSAR와 같은 광범위한 공공 데이터베이스를 분석하여 약물 민감도와 유전자 발현 프로필 간의 상관관계를 파악하고, 이를 통해 질병 메커니즘에 대한 시스템 수준의 이해를 제공합니다.46 AI가 식별한 표적 중 상당수가 실험적 검증을 거치고 있으며, 여러 AI 기반 약물이 이미 임상 시험 단계에 진입하고 있어 이 분야에서 AI의 신뢰성이 높아지고 있음을 보여줍니다.44 예를 들어, 아스트라제네카는 BenevolentAI와의 협력을 통해 잘 알려진 레닌-안지오텐신 시스템을 넘어선 만성 신장 질환(CKD)의 새로운 표적을 성공적으로 식별하여 새로운 치료 경로를 열었습니다.15

단백질 설계 및 선도 물질 최적화

AI 기반 de novo 단백질 설계는 특정 치료 목표를 염두에 두고 처음부터 완전히 새로운 단백질을 생성할 수 있게 합니다.14 AI 알고리즘은 이렇게 새로 설계된 단백질의 특성을 최적화하는 데 능숙합니다. 예를 들어, 질병 표적에 대한 결합력 향상, 체내 분해에 대한 저항성 증가, 다양한 약물 전달 시스템과의 호환성 개선 등이 가능합니다.14

선도 물질 최적화: 이는 신약 개발에서 초기 “히트(hit)” 화합물을 개선된 약리학적 특성을 가진 실행 가능한 약물 후보로 정밀하게 개선하는 중요하고 반복적인 단계입니다.43 AI는 빅데이터 분석과 고급 예측 모델링을 활용하여 이 과정을 크게 가속화합니다.43 AI는 선도 물질의 분자 구조를 미세 조정하여 표적 생체 분자와의 최적의 상호작용을 달성하는 동시에 바람직하지 않은 비표적 효과를 최소화하는 데 도움을 줍니다.43 AI는 결합 친화도 및 ADMET(흡수, 분포, 대사, 배설, 독성) 프로필과 같은 중요한 특성을 예측할 수 있어, 광범위하고 비용이 많이 드는 실험적 검증의 필요성을 크게 줄입니다.10 딥 신경망(DNN) 및 강화 학습을 포함한 고급 딥러닝 기술은 화합물 설계를 안내하고 정밀하게 최적화된 특성을 가진 새로운 분자를 생성하는 데 활용됩니다.34 예를 들어, BIOVIA Generative Therapeutics Design (GTD) 애플리케이션은 리간드-단백질 상호작용의 3D 구조 모델을 효과적으로 활용하여 SYK 억제제 발견에서 흔히 발생하는 선도 물질 탐색 및 최적화 문제를 해결했습니다.43

전임상 개발

AI는 잠재적 독성 및 효능을 포함한 분자 특성을 정확하게 예측함으로써 전임상 약물 발견을 향상시킵니다.9 이는 바람직한 온-타겟 효과를 보이는 유망한 화합물을 지능적으로 선택하는 동시에, 오프-타겟 활성 또는 불리한 약동학적 특성과 같은 바람직하지 않은 특성을 가진 화합물을 배제하는 데 도움을 줍니다.48 Madrigal과 같은 다중 모드 AI 모델은 구조 정보, 경로 데이터, 세포 생존력 분석 및 전사체 데이터 등 다양한 데이터 유형을 통합하여 약물 조합의 효과를 예측할 수 있습니다. 여기에는 잠재적인 약물 상호작용 및 독성 위험 예측이 포함됩니다.16 이러한 능력은 안전하고 효과적인 약물 조합을 식별하고 후기 임상 실패를 줄이는 데 가장 중요합니다.49 2022년 FDA 현대화법 2.0은 ‘장기 온 칩(organs-on-chips)’과 같은 비동물 기반 테스트 방법에 대한 개방성을 시사합니다. AI 모델은 이러한 보다 윤리적이고 효율적인 실험 접근 방식을 개발하고 검증하는 데 중요한 역할을 할 것으로 예상됩니다.13

임상 시험 최적화

AI는 환자 모집을 크게 개선하고, 임상 시험 설계를 최적화하며, 시험 결과에 대한 예측 모델링을 향상시킴으로써 임상 시험에 혁명을 일으키고 있습니다.7 AI 알고리즘은 전자 건강 기록(EHR)을 신속하게 평가하여 환자 적격성을 빠르게 판단하고, 적합한 후보자가 시험에 스크리닝되도록 보장합니다.7 예측 모델링 기능은 AI가 과거 데이터와 환자 특성을 활용하여 초기 임상 연구의 용량 증량 전략 및 독성 예측을 포함한 다양한 시험 설계를 시뮬레이션할 수 있도록 합니다.7 AI 도구는 용량, 치료 기간, 환자 특성과 같은 중요한 변수를 조정하여 연구 프로토콜을 최적화하여 보다 효율적이고 효과적인 시험으로 이어집니다.7 적응형 임상 시험 설계, 실시간 데이터 분석, 원격 모니터링(분산형 임상 시험, DCT 촉진)의 구현은 AI에 의해 크게 향상되지만, 견고한 인프라와 규제 승인이 필요합니다.7 AI는 또한 실제 데이터(RWD)와 과거 시험 데이터를 사용하여 대조군을 시뮬레이션하는 합성 대조군(SCA)의 사용을 지원하여 전통적인 위약군과 관련된 윤리적, 물류적, 비용적 문제를 줄입니다.7 나아가 AI는 다양한 약물 특성을 기반으로 용량, 안전성, 효능을 예측하여 최적의 약물 후보를 선택하는 데 도움을 줄 수 있습니다. 이는 환자에게 초저용량을 테스트하는 “0+상” 시험을 가능하게 하여 현재의 “시험-관찰” 방식의 임상 시험 비용을 줄일 수 있습니다.12

AI의 강력한 멀티-오믹스 데이터 분석 능력 7과 약물 조합 효과에 대한 미묘한 예측 능력 49은 일반적인 치료법에서 벗어나 근본적인 변화가 일어나고 있음을 강력히 시사합니다. 유전체 프로필이 특정 억제제 발견 및 환자 선택을 안내하는 “개인화된 모델”의 개념은 7 정밀 의학의 원칙과 직접적으로 일치합니다. AI가 특정 환자 집단에 대한 개입을 맞춤화하고 50 예측 바이오마커를 식별하는 능력은 4 이러한 경로를 더욱 공고히 합니다. 이는 AI의 영향이 단순히 약물 개발 과정을 최적화하는 것을 넘어, 약물 적용 과정을 근본적으로 변화시키고 있음을 의미합니다. 이러한 변화는 각 개인의 생물학적 프로필에 맞는 정확한 약물 매칭을 가능하게 하여 부작용을 최소화하고 전반적인 임상 결과를 크게 개선함으로써 더욱 효과적이고 안전한 치료법을 탄생시킵니다. 이러한 발전은 의료가 반응형 모델에서 사전 예방적, 개인화된, 예방적 모델로 전환되는 더 넓은 비전과 완벽하게 일치합니다.10

또한, AI는 ‘난공불락’ 표적과 새로운 치료 방식에 대한 접근을 가능하게 합니다. 역사적으로 전통적인 신약 개발은 비교적 적은 수의 ‘약물 개발 가능한’ 단백질에 국한되어 있었습니다.31 그러나 AI 기반 de novo 설계 및 최적화 능력은 완전히 새로운 단백질을 생성하고 14, 결정적으로 이전에 접근 불가능하거나 ‘난공불락’으로 여겨졌던 생물학적 영역을 표적으로 삼을 수 있게 합니다. GB-0669 단일클론 항체는 이러한 사례의 대표적인 예시입니다.27 이는 미니단백질 치료제 29 및 고급 펩타이드 치료제 39와 같이 전통적인 방법으로는 설계하기 어려웠던 복잡한 치료 방식의 출현과 빠른 개발로 더욱 입증됩니다. 이는 AI가 기존의 약물 개발 패러다임을 개선하는 것을 넘어, 치료 환경을 근본적으로 확장하고 있음을 의미합니다. 이전에 접근 불가능했던 생물학적 표적과 새로운 약물 방식(미니단백질, 복합 펩타이드, 어려운 에피토프에 대한 항체 등)을 약물 개발에 활용 가능하게 함으로써, AI는 역사적으로 전통적인 치료법에 저항성이 있었던 질병들을 치료하기 위한 완전히 새로운 길을 열어주고 있습니다. 이러한 능력은 약물 개발의 ‘무리 짓기’ 경향을 역전시키고 15 미충족 의료 수요를 해결하는 데 진정한 혁신을 촉진하는 데 중요합니다.

V. 현재 상황: 성공 사례 및 신흥 단백질 치료제

임상 개발 중인 AI 설계 약물

제약 산업은 AI가 설계한 약물(소분자 및 바이오의약품 모두 포함)이 이미 임상 시험 단계를 진행하고 있는 가시적인 변화를 목격하고 있습니다.27 2023년 12월 현재, 21개의 AI 개발 약물이 성공적으로 1상 임상 시험을 완료했으며, 80~90%라는 인상적인 성공률을 보였습니다. 이는 전통적인 방식으로 발견된 약물의 해당 단계 성공률인 약 40%보다 훨씬 높은 수치입니다.28 AI 개발 후보 물질이 임상 단계에 진입하는 추세는 2016년 3개에서 2020년 17개, 2023년 67개로 기하급수적인 성장을 보이고 있습니다.28

주요 AI 설계 약물 후보군:

 

약물명 표적/적응증 약물 유형 AI 플랫폼/회사 현재 임상 단계 주요 특징/참고 사항
INS018_055 특발성 폐섬유증 (IPF) 소분자 Insilico Medicine 임상 2상 AI 플랫폼으로 46일 만에 발견; 폐 기능 개선에서 용량 의존적 반응 확인 5
GB-0669 SARS-CoV-2 단일클론 항체 (단백질) Generate Biomedicines 임상 1상 이전에 ‘난공불락’으로 여겨졌던 영역 표적; 17개월 만에 임상 진입 27
ABS-101 염증성 장 질환 (IBD) 항체 (단백질) Absci 임상 1상 높은 효능, 낮은 면역원성, 분기별 피하 투여 가능; AMD로부터 2천만 달러 투자 53
경구용 IL-17 억제제 자가면역 질환 펩타이드 Pepticom 전임상/개발 중 기록적인 시간과 비용으로 개발; 높은 안정성 및 반감기; 비자연 아미노산 활용 52
미니단백질 치료제 대사 질환, 염증성 질환 미니단백질 (단백질) AI Proteins 전임상/개발 중 de novo 설계, 초안정성, 고특이성; Bristol Myers Squibb와 4억 달러 협력 29
KumaMax 셀리악병 효소 (단백질) UW Institute for Protein Design (스핀아웃) 임상 시험 중 (Takeda Pharmaceuticals) UW 학부 프로젝트에서 시작된 효소 32
COVID-19 백신 COVID-19 단백질 UW Institute for Protein Design 승인 및 사용 중 로열티 프리; 영국, 한국 승인, WHO 긴급 사용 목록 등재 32

INS018_055는 소분자이지만, AI의 신약 설계 속도를 강력하게 보여주며, 단백질 신약 개발 전반에 미치는 AI의 광범위한 영향을 시사합니다.

이러한 표는 AI가 이론적인 잠재력을 넘어 실제 임상적 영향으로 나아가고 있음을 보여주는 강력한 경험적 증거입니다. 약물 유형별 분류를 통해 AI가 소분자, 항체, 펩타이드, 효소 등 다양한 치료 방식에 적용될 수 있음을 강조합니다. 특히 ‘주요 특징/참고 사항’ 열은 AI가 가져온 특정 이점, 예를 들어 개발 기간 단축, 이전에 ‘난공불락’으로 여겨졌던 생물학적 경로 표적화 능력, 또는 안정성 및 효능 향상과 같은 약물 특성 개선 등을 명확히 보여줍니다. 이러한 포괄적인 개요는 AI가 계산적 설계를 실제 임상적 영향으로 전환하는 데 있어 이룬 구체적인 진전을 강조합니다.

주요 혁신 기업

학술/연구 기관:

  • 데이비드 베이커 연구실 (워싱턴 대학교 단백질 설계 연구소): 계산 단백질 설계 분야의 세계적인 선두 주자로서, Top7과 같은 새로운 단백질 접힘을 설계하고 RoseTTAFold, ProteinMPNN, RFDiffusion과 같은 핵심 AI 도구를 개발했습니다.19 데이비드 베이커는 데미스 허사비스, 존 점퍼와 함께 2024년 노벨 화학상을 수상했습니다.2
  • Google DeepMind: 단백질 구조 예측에 혁명을 일으킨 AlphaFold를 개발했습니다.7 또한 또 다른 단백질 설계 AI인 AlphaProteo를 개발했습니다.55
  • OpenAI: GPT-4b micro를 포함한 단백질 설계 AI를 활발히 개발하고 있습니다.55
  • 칭화대학교: 딥러닝을 활용한 단백질 설계 연구를 수행하는 저명한 기관입니다.22
  • 히브리 대학교: Pepticom의 AI 기반 펩타이드 치료제에 대한 기초 연구가 이곳에서 시작되었습니다.52

기업 (AI-first 바이오텍 및 대형 제약사 협력):

  • Insilico Medicine: AI 기반 신약 발견의 선두 기업으로, INS018_055 개발 5 및 구조 기반 약물 설계에 AI 활용 15으로 잘 알려져 있습니다.
  • Generate Biomedicines: AI가 설계한 단일클론 항체 GB-0669를 개발했으며 27, 생성 모델을 활용하여 de novo 단백질을 설계합니다.29
  • Absci: 데이터 중심의 생성형 AI 약물 개발 회사로, 항체 ABS-101이 1상 임상 시험 중입니다. AI와 합성 생물학 도구(SoluPro 시스템, ACE Assay)를 결합한 통합 약물 생성 플랫폼을 통해 신속한 de novo 항체 설계 및 최적화를 수행합니다.53 최근 AMD로부터 2천만 달러의 지분 투자를 받았습니다.54
  • AI Proteins: de novo 설계된 미니단백질 치료제 분야의 선구자로, Bristol Myers Squibb와 4억 달러 규모의 중요한 협력을 진행하고 있습니다.29 분비 공학, 대사 질환 치료제, 단백질 생산 자동화 분야에서 활발히 발전하고 있습니다.51
  • Profluent: 자연 단백질과 동등한 기능을 하는 AI 생성 단백질로 유명하며, 세계 최초의 오픈소스 AI 설계 유전자 편집기인 OpenCRISPR-1을 출시했습니다.29
  • Xaira Therapeutics: 2024년에 10억 달러의 자금으로 설립된 신생 기업으로, 머신러닝, 기능 유전체학, 단백질체학을 결합합니다. 노벨상 수상자인 데이비드 베이커 박사가 공동 설립했습니다.29
  • DenovAI: AI 기반 항체 및 미니단백질 결합체 설계 전문 기업입니다.29
  • Biomatter: “Intelligent Architecture™” 플랫폼을 활용하여 건강 및 지속 가능한 제조 분야에 응용되는 효소 설계 선두 기업입니다.56 최근 650만 유로의 시드 펀딩을 확보했습니다.56
  • Pepticom: AI 기반 펩타이드 치료제 분야의 선구자입니다.52
  • Gubra: de novo 펩타이드 설계 및 최적화를 포함한 펩타이드 기반 약물 발견에 AI 기반 방법론을 적극적으로 활용하고 있습니다.39
  • Isomorphic Labs (Alphabet): 차세대 AI 약물 설계 모델 개발을 위해 6억 달러를 유치했으며, Eli Lilly 및 Novartis와 같은 주요 제약사와 소분자 발견을 위한 파트너십을 맺었습니다.57
  • Recursion: 구조 기반 약물 설계에 AI를 활용하며 15, 표적 역분해(target deconvolution)를 위한 지식 그래프 도구를 사용합니다.58
  • Iambic: 특수 AI 시스템(Magnet, NeuralPLexer, Enchant)을 통합하여 분자 설계, 구조 예측 및 임상 특성 추론을 계산적으로 수행합니다.58
  • 대형 제약사 (예: AstraZeneca, Pfizer, Merck, Roche): 이들 산업 거인들은 AI 역량에 적극적으로 투자하고, AI 중심 바이오텍과의 전략적 파트너십을 형성하며, R&D 파이프라인을 강화하기 위한 강력한 내부 AI 플랫폼을 개발하고 있습니다.2
  • 국내 기업: 대웅제약(AIVS 플랫폼) 2, 온코닉테라퓨틱스 5, 닥터노아바이오텍(ARK), 온코크로스(랩터AI), 파로스아이바이오(케미버스), JW중외(제이웨이브), SK바이오팜(HUBLE Plus) 59, 이노보테라퓨틱스(INV-001) 62 등이 있습니다.

획기적인 발전의 영향

데이비드 베이커, 데미스 허사비스, 존 점퍼가 AI 기반 단백질 구조 예측 및 설계 연구로 2024년 노벨 화학상을 수상한 것은 2 생명 과학 분야에서 AI의 혁신적인 잠재력을 기념하는 기념비적인 사건입니다. 이러한 인정은 AI 기술이 틈새 계산 도구에서 주류의 중요한 과학 분야로 발전했음을 의미합니다.28

AI 기반 접근 방식은 임상 초기 단계에서 훨씬 더 높은 성공률을 보여주었습니다. AI로 개발된 약물의 80~90%가 1상 임상 시험을 완료했으며, 이는 전통적인 방법의 약 40%와 비교됩니다.28 이는 AI가 개발 파이프라인 초기에 더 유망한 약물 후보를 식별하고 우선순위를 정하는 데 효과적임을 나타냅니다. AI는 선도 물질 식별에 필요한 시간을 평균 약 2년에서 6개월 미만으로 단축하고, 개발 비용을 30~50% 절감할 수 있는 잠재력을 가지고 있습니다.42

AI가 개발한 약물 후보군이 1상 임상 시험에서 80-90%라는 높은 성공률을 보인다는 보고는 28 AI가 초기 단계에서 우수한 후보 물질을 선별하는 데 효과적임을 강력히 시사합니다. 그러나 현재까지 AI가 설계한 약물 중 FDA 승인을 받은 것은 없으며 11, ‘AI-퍼스트’ 약물의 완전한 잠재력은 긴 개발 기간으로 인해 아직 ‘완전히 실현되지 않았다’고 평가됩니다.15 또한, ‘이룸의 법칙’ 3이라는 지속적인 과제는 더 복잡하고 비용이 많이 드는 후기 임상 단계에서도 AI가 발견한 후보 물질에 여전히 적용됩니다. 이는 AI의 현재 주요 영향이 개발 초기 단계에서 성공 확률을 높이는 것이지, 후기 단계의 성공을 보장하는 것은 아님을 의미합니다. 이는 가장 진보된 AI 모델조차도 완전히 포착할 수 없는 인간 생물학 시스템과 실제 세계의 복잡성으로 인해 임상 시험의 예측 불가능성이 존재하기 때문입니다.3 따라서 AI의 역할은 초기 단계에서 더 나은 후보 물질을 식별하고 우선순위를 정함으로써 임상 시험에 진입하는 약물의 품질을 향상시키는 데 있습니다. 그러나 최종적인 성공(FDA 승인)은 복잡하고 종종 예측 불가능한 후기 임상 시험을 성공적으로 통과하는 데 달려 있으며, 이는 지속적인 인간의 감독과 실험적 검증의 필요성을 강조합니다.

AI가 설계한 약물들이 소분자(INS018_055)를 넘어 단일클론 항체(GB-0669, ABS-101), 미니단백질(AI Proteins), 펩타이드(Pepticom, Gubra) 등 다양한 단백질 기반 치료제로 확장되고 있다는 점은 5 AI의 능력이 단일 약물 종류에 국한되지 않음을 의미합니다. 이러한 다각화는 AI가 전통적인 소분자로 접근하기 어려웠던 광범위한 질병과 생물학적 표적에 접근할 수 있음을 나타냅니다. 이는 AI가 ‘자연 진화의 불완전성이나 타협점에 구애받지 않고 현대 의학의 요구에 맞춰 구축된’ 14 ‘새로운 세대의 바이오 의약품’ 개발을 가능하게 한다는 것을 시사합니다. 이는 고도로 정밀하고 맞춤화된 치료법의 잠재력을 확장하며, 새로운 치료 경로를 개척합니다.

VI. 도전 과제 및 한계점 극복

데이터 관련 난관

AI의 잠재력을 완전히 실현하는 데 있어 중요한 장애물은 작고, 품질이 낮고, 불완전하며, 일관성이 없는 데이터셋입니다.7 AI 모델을 훈련하는 데 필요한 수백만에서 수십억 개의 화합물에 대한 포괄적이고 고품질의 약물 관련 데이터를 세포, 동물 또는 인간으로부터 생성하는 것은 여전히 어려운 과제입니다.12 훈련 데이터셋이 다양한 환자 집단을 적절하게 대표하지 못하는 경우, AI 모델에 편향이 발생하여 소외된 집단에 대한 예측이 최적화되지 않거나 부정확할 수 있습니다.7 과거 데이터에 대한 의존은 모델이 과거 패턴에 과적합되거나 새로운 약물 표적 또는 화학 물질에 대한 일반화 능력이 부족할 수 있습니다.7 마찬가지로, 훈련 데이터셋을 확장하는 데 유용한 합성 데이터도 실제 세계의 가변성을 정확하게 반영하지 못하는 이상적인 결과물을 생성할 위험이 있습니다.7 단절된 공공 데이터셋은 FAIR(Findable, Accessible, Interoperable, and Re-usable) 원칙과 본질적으로 상충됩니다.4 또한, 규제 및 개인 정보 보호 문제로 인해 상당량의 고가치 독점 데이터가 대형 제약 회사에 의해 통제되어 광범위한 AI 모델 훈련에 활용되기 어렵습니다.28

계산 복잡성

AI 모델, 특히 딥러닝 모델의 “블랙박스” 특성은 중요한 과제입니다. 이들의 의사결정 과정은 종종 불투명하여 예측의 근거를 이해하기 어렵습니다.11 이러한 투명성 부족은 일반적으로 명확한 증거와 기계적 이해를 요구하는 규제 승인에 상당한 장애물이 됩니다.30 AI가 생성한 분자에 대한 표준화된 벤치마크의 부재는 규제 경로를 더욱 복잡하게 만듭니다.30 또한, 확산 모델과 같은 복잡한 AI 모델을 훈련하고 배포하는 데는 고성능 GPU 클러스터 형태의 막대하고 값비싼 계산 자원이 필요합니다.16 단백질을 정확하게 모델링하려면 생물학적 시스템 내에서 단백질의 동적인 특성과 내재된 유연성을 고려해야 하는데, 이는 설계 과정에 상당한 계산 복잡성을 더합니다.21

번역적 격차 (Translational Gap)

전임상 성공, 특히 생쥐와 같은 in vivo 동물 모델에서의 성공이 인간 환자에게 신뢰할 수 있는 결과로 잘 이어지지 않는다는 것은 지속적이고 잘 알려진 과제입니다.3 이러한 번역적 격차는 후기 임상 시험에서 높은 실패율의 주요 원인입니다.3 약물이 인간의 복잡한 다기관 시스템에 미치는 전신적 영향을 예측하는 것은 통제된 in vitro 또는 동물 모델에서 표적 조절을 예측하는 것보다 훨씬 더 어렵고 고차원적인 문제입니다.3 “모달리티 누락(missing modality)” 문제는 포괄적인 임상 안전성 프로필, 장기 효능 데이터, 상세한 약동학적 데이터와 같은 중요한 데이터가 전임상 및 초기 임상 개발 단계에서 새로운 화합물에 대해 종종 부족하다는 점을 강조합니다.49

규제 및 윤리적 고려 사항

AI 기반 신약 개발은 방대한 양의 민감한 환자 데이터를 처리해야 합니다. 이는 데이터 개인 정보 보호, 무단 접근 가능성, 익명화된 데이터에서 개인 식별 가능성, 그리고 엄격한 데이터 보호 규정 준수에 대한 심각한 우려를 제기합니다.7 FDA와 같은 규제 기관은 약물 안전성 및 효능에 대한 실질적이고 재현 가능한 증거를 요구합니다. 이는 AI 모델의 반복적이고 예측적이며 확률적인 특성과 종종 충돌하여 승인 과정을 지연시킬 수 있습니다.7 AI가 생성한 분자에 대한 표준화된 벤치마크의 부재는 규제 경로를 더욱 복잡하게 만듭니다.30

중요한 윤리적 우려는 AI 기반 생명공학 도구의 “이중 용도 잠재력”입니다. 유익한 목적으로 설계되었지만, 이러한 강력한 혁신은 전례 없는 정밀도와 효능을 가진 생물학적 무기를 개발하는 것과 같은 해로운 목적으로 오용될 수 있습니다.65 이러한 내재된 위험은 즉각적인 주의와 오용 방지를 위한 강력한 프레임워크 구축을 요구합니다.65 AI가 새로운 분자를 빠르게 생성함에 따라 지적 재산권 소유권에 대한 복잡한 질문이 제기됩니다. AI 시스템이 “발명가”로 간주될 수 있는지에 대한 모호성이 존재합니다.30 또한, 훈련 데이터가 불균형하여 발생하는 편향 외에도, 알고리즘적 편향은 특히 임상 시험 환자 모집과 같은 민감한 영역에서 왜곡된 결과를 초래하여 특정 인구 집단을 배제할 수 있습니다.30

여러 연구들은 데이터 부족, 품질, 불일치 및 편향이 AI의 근본적인 한계로 작용함을 일관되게 지적합니다.7 이미지 분석이나 언어 처리 분야의 데이터 가용성과 비교했을 때 12, 약물 개발 데이터는 본질적으로 대규모로 일관된 품질로 생성하기가 더 어렵습니다. 초기 단계에서 중요한 임상 데이터가 부족한 “모달리티 누락” 문제 49는 포괄적인 데이터 표현을 더욱 복잡하게 만듭니다. “전임상 및 임상 데이터셋의 조화” 3와 “올바른 데이터 기반 구축” 3에 대한 반복적인 요구는 단순히 더 많은 데이터를 축적하는 것만으로는 불충분하며, 데이터가 신약 개발 전 과정에 걸쳐 더 잘 통합되고, 표준화되며, 대표성을 갖춰야 한다는 것을 의미합니다. 이는 AI 기반 단백질 신약 개발의 궁극적인 성공이 알고리즘 발전뿐만 아니라 생물학적 및 임상 데이터가 수집, 관리 및 공유되는 방식의 근본적인 변화에 결정적으로 의존한다는 것을 보여줍니다. 이러한 변화는 광범위한 산업 협력(예: Melloddy 프로젝트 13, Pistoia Alliance 4)과 함께, 중요한 개인 정보 보호 문제를 신중하게 균형을 맞추면서 데이터 공유를 위한 새로운 규제 인센티브가 필요할 수 있습니다. 이러한 “데이터 중심” 병목 현상을 해결하지 못한다면, AI의 완전한 혁신적 잠재력은 훈련 데이터의 내재된 한계에 의해 제약될 것입니다.

또한, 많은 고급 AI 모델의 본질적인 “블랙박스” 특성은 규제 승인에 있어 중요한 과제를 제기합니다. 이들의 의사결정 과정이 불투명하여 규제 기관의 승인을 복잡하게 만들 수 있습니다.11 이는 설명 가능한 AI(XAI)의 개발이 이 문제를 해결하는 데 중요함을 의미합니다.30 규제 기관은 진화하는 AI 기술을 수용하면서 안전성과 효능을 보장하는 민첩하고 적응적인 프레임워크를 개발해야 합니다.7 AI 기반 생명공학 도구의 “이중 용도 잠재력”은 중요한 윤리적 문제입니다. 유익한 목적으로 설계되었지만, 이러한 강력한 혁신은 해로운 목적으로 오용될 수 있습니다.65 이는 새로운 법률 제정 및 윤리적 지침의 필요성을 강조합니다. AI가 생성한 분자의 지적 재산권 소유권에 대한 모호성도 해결해야 할 과제입니다.30

VII. 미래 전망 및 전략적 과제

시장 성장 전망 및 투자 동향

글로벌 AI 신약 개발 시장은 2024년부터 2030년까지 연평균 37.67%의 높은 성장률을 보이며 수백억 달러 규모로 성장할 것으로 예측됩니다.42 북미 AI 제약 및 바이오텍 시장은 2025년부터 2032년까지 연평균 41.9% 성장하여 2032년에는 397.8억 달러에 이를 것으로 전망됩니다.60 단백질 공학 시장 또한 2025년부터 2033년까지 연평균 16.97% 성장하여 2033년에는 178.3억 달러에 달할 것으로 예상됩니다.68 제약 산업의 AI 지출은 2025년까지 30억 달러에 이를 것으로 추정됩니다.69

투자 동향을 살펴보면, 제약 회사와 AI 스타트업 간의 파트너십이 증가하고 있습니다.41 Isomorphic Labs는 차세대 AI 약물 설계 모델 개발을 위해 6억 달러를 유치했으며 57, Absci는 AMD로부터 2천만 달러의 전략적 투자를 받았습니다.54 이는 AI 기반 신약 개발에 대한 강력한 투자자 관심을 보여줍니다. 그러나 국내에서는 AI 신약 개발 기업의 수가 2022년 약 52개에서 약 30개로 줄고 투자금도 감소하는 등 다소 부진한 모습을 보이고 있습니다.62

성공을 위한 핵심 요인

AI 기반 단백질 신약 개발의 성공을 위해서는 여러 핵심 요인들이 유기적으로 결합되어야 합니다.

  • 데이터 기반: 고품질의 표준화되고 통합된 다중 모달리티 데이터셋은 AI 모델 훈련의 필수적인 기반입니다.3 AI의 궁극적인 성공은 알고리즘 발전뿐만 아니라 생물학적 및 임상 데이터가 수집, 관리 및 공유되는 방식의 근본적인 변화에 결정적으로 의존합니다. 이는 데이터 품질, 통합 및 표준화가 가장 중요하며, 단순히 더 많은 데이터를 축적하는 것만으로는 불충분하다는 것을 의미합니다. 대신, 데이터가 신약 개발 전 과정에 걸쳐 더 잘 통합되고, 표준화되며, 대표성을 갖춰야 한다는 것을 의미합니다. 이러한 변화를 위해서는 광범위한 산업 협력(예: Melloddy 프로젝트 13, Pistoia Alliance 4)과 함께, 중요한 개인 정보 보호 문제를 신중하게 균형을 맞추면서 데이터 공유를 위한 새로운 규제 인센티브가 필요할 수 있습니다. 이러한 “데이터 중심” 병목 현상을 해결하지 못한다면, AI의 완전한 혁신적 잠재력은 훈련 데이터의 내재된 한계에 의해 제약될 것입니다.
  • 알고리즘 발전: AlphaFold 3와 같은 더욱 정확하고, 해석 가능하며, 일반화 가능한 AI 모델(생성 모델, 설명 가능한 AI(XAI) 포함)의 지속적인 개발이 중요합니다.27 많은 고급 AI 모델의 본질적인 “블랙박스” 특성은 규제 승인에 있어 중요한 과제를 제기합니다. 이들의 의사결정 과정이 불투명하여 규제 기관의 승인을 복잡하게 만들 수 있습니다.11 이는 설명 가능한 AI(XAI)의 개발이 이 문제를 해결하는 데 중요함을 의미합니다.30 규제 기관은 진화하는 AI 기술을 수용하면서 안전성과 효능을 보장하는 민첩하고 적응적인 프레임워크를 개발해야 합니다.7 AI 기반 생명공학 도구의 “이중 용도 잠재력”은 중요한 윤리적 문제입니다. 유익한 목적으로 설계되었지만, 이러한 강력한 혁신은 해로운 목적으로 오용될 수 있습니다.65 이는 새로운 법률 제정 및 윤리적 지침의 필요성을 강조합니다. AI가 생성한 분자의 지적 재산권 소유권에 대한 모호성도 해결해야 할 과제입니다.30
  • 실험적 검증 및 AI-실험실 루프: in silico 설계와 습식 실험실 실험 간의 반복적인 피드백 루프는 예측을 정교화하고 실제 세계에서의 효능을 보장하는 데 결정적입니다.27
  • 학제 간 협력: 생물학자, 컴퓨터 과학자, 화학자, 윤리학자 간의 필수적인 파트너십은 AI 기반 연구의 복잡한 환경을 탐색하는 데 중요합니다.17
  • 적응형 규제 프레임워크: 진화하는 AI 기술을 수용하면서 안전성과 효능을 보장하는 민첩하고 적응적인 규제 프레임워크의 개발이 필요합니다.7
  • 윤리적 거버넌스: 데이터 개인 정보 보호, 편향, 이중 용도 위험 및 지적 재산권 문제 해결을 위한 사전 예방적 조치가 중요합니다.7

AI는 인간의 전문성과 결합될 때 가장 큰 가치를 발휘하는 도구입니다. AI가 약물 개발에 혁명을 일으킬 것이라는 주장은 AI가 ‘블랙박스’가 아니며, 현명하고 유능하게 사용될 때 약물 실패의 근본 원인을 해결하고 프로세스를 간소화하는 데 도움이 될 수 있다는 관점에서 이해되어야 합니다.11 AI가 이미지 분석이나 언어 처리와 같은 다른 분야에서 큰 성공을 거둔 것과는 달리, 약물 개발에 미치는 영향은 아직 명확하지 않다는 지적도 있습니다.12 이는 AI가 인간의 지능을 대체하는 것이 아니라, 인간의 역량을 증강하는 역할을 한다는 것을 의미합니다. 최적의 접근 방식은 AI의 계산 능력과 인간의 전문 지식을 결합하는 것입니다. 예를 들어, 인간과 컴퓨터 알고리즘의 조합이 인간 단독 또는 컴퓨터 알고리즘 단독보다 우수하다는 점은 체스에서 입증되었습니다.11 이는 AI가 데이터 분석, 생성, 예측과 같은 강점을 가진 작업에 집중하고, 인간은 중요한 감독, 실험적 검증, 윤리적 판단을 제공해야 한다는 것을 의미합니다. 이러한 협력적 접근 방식은 AI의 잠재력을 최대한 활용하면서도 복잡한 생물학적 시스템과 실제 임상 환경의 미묘한 차이를 이해하는 데 있어 인간의 필수적인 역할을 인정합니다.

또한, ‘이룸의 법칙’과 투자자들의 단기적인 투자 수익률(ROI) 기대 사이의 긴장 관계를 인식하는 것이 중요합니다.3 AI 기반 신약 개발의 진정한 혁명은 단순히 몇몇 약물 후보 물질을 시장에 내놓는 것을 넘어, 기초 데이터와 복잡한 생물학적 모델링에 대한 장기적인 투자를 통해 파이프라인 전반의 성공률을 일관되게 향상시킬 수 있는 강력한 AI 플랫폼을 구축하는 데 있습니다.3 이는 단기적인 성과에만 집중하는 것이 아니라, 장기적인 관점에서 AI 기술의 성숙과 통합을 위한 지속적인 노력이 필요하다는 것을 시사합니다.

전반적인 잠재력

AI는 신약 개발을 가속화하고, 위험을 줄이며, 그 범위를 확장하는 혁신적인 도구입니다. 이는 더 효율적이고 정밀하며 개인화된 치료법을 가능하게 하여 미충족 의료 수요를 해결하는 데 기여할 것입니다.

VIII. 결론

인공지능 기반 단백질 설계는 신약 개발 분야에 전례 없는 혁신을 가져오고 있으며, 그 성공 가능성은 매우 높습니다. AI는 단백질 구조 예측 및 설계의 복잡성을 해결하고, 신약 개발 파이프라인 전반의 비효율성을 줄이며, 새로운 치료 방식의 개발을 가능하게 합니다. AI가 설계한 약물 후보 물질들이 임상 초기 단계에서 보여주는 높은 성공률은 AI의 잠재력을 강력하게 시사합니다.

그러나 이러한 혁신적인 잠재력을 완전히 실현하기 위해서는 몇 가지 중요한 과제를 극복해야 합니다. 고품질의 방대한 데이터 확보, AI 모델의 투명성 및 해석 가능성 향상, 전임상 결과의 인체 적용 가능성 개선, 그리고 복잡한 규제 및 윤리적 문제 해결이 필수적입니다. 특히, 데이터의 양과 질을 개선하고, AI 모델의 ‘블랙박스’ 특성을 해소하기 위한 설명 가능한 AI(XAI) 기술을 발전시키는 것이 중요합니다. 또한, AI 기반 생명공학 도구의 이중 용도 잠재력과 지적 재산권 문제에 대한 명확한 윤리적 및 규제적 프레임워크 마련이 시급합니다.

궁극적으로 AI는 인간의 전문성을 대체하는 것이 아니라, 이를 보완하고 증강하는 강력한 도구입니다. 생물학자, 컴퓨터 과학자, 화학자, 윤리학자 간의 긴밀한 학제 간 협력과 in silico 설계와 습식 실험실 검증을 반복하는 ‘AI-실험실 루프’ 접근 방식이 AI 기반 단백질 신약 개발의 성공을 위한 핵심 전략이 될 것입니다. 이러한 노력을 통해 AI는 신약 개발의 시간과 비용을 획기적으로 줄이고, 이전에 치료가 어려웠던 질병에 대한 혁신적인 솔루션을 제공하며, 궁극적으로 인류 건강 증진에 지대한 공헌을 할 것으로 기대됩니다.

참고 자료

  1. m.yakup.com, 5월 26, 2025에 액세스, http://m.yakup.com/news/index.html?mode=view&cat=hot&cat2=&nid=279944&num_start=3#:~:text=AI(%EC%9D%B8%EA%B3%B5%EC%A7%80%EB%8A%A5)%20%EA%B8%B0%EB%B0%98%20%EC%9D%B8%EA%B3%B5,%EC%8B%A0%EC%95%BD%EA%B0%9C%EB%B0%9C%20%EA%B0%80%EB%8A%A5%EC%84%B1%EC%9D%B4%20%EC%97%B4%EB%A0%B8%EB%8B%A4.
  2. 신약개발에서의 AI 활용 – 한국바이오협회, 5월 26, 2025에 액세스, https://www.koreabio.org/board/download.php?board=Y&bo_table=brief&file_name=b_file_1743397434w0soyh5tj2.pdf&o_file_name=%EC%9B%94%EA%B0%84+%EB%B8%8C%EB%A6%AC%ED%94%84+198%ED%98%B8_%EC%8B%A0%EC%95%BD%EA%B0%9C%EB%B0%9C%EC%97%90%EC%84%9C%EC%9D%98+ai+%ED%99%9C%EC%9A%A9.pdf
  3. Is AI Failing Drug Development? The Unseen Challenges – HIT Consultant, 5월 26, 2025에 액세스, https://hitconsultant.net/2025/01/16/is-ai-failing-drug-development-the-unseen-challenges/
  4. Using clinical genomics and AI in drug development to elevate success, 5월 26, 2025에 액세스, https://www.drugtargetreview.com/article/155906/clinical-genomics-ai-drug-success/
  5. [AI신약 임상]① 인공지능 신약개발, 선점 노리는 글로벌 대표 주자들+ …, 5월 26, 2025에 액세스, https://pharm.edaily.co.kr/news/read?newsId=01653126639119504
  6. Perspective on the challenges and opportunities of accelerating drug discovery with artificial intelligence – Frontiers, 5월 26, 2025에 액세스, https://www.frontiersin.org/journals/bioinformatics/articles/10.3389/fbinf.2023.1121591/full
  7. Integrating artificial intelligence in drug discovery and early drug development: a transformative approach – PMC, 5월 26, 2025에 액세스, https://pmc.ncbi.nlm.nih.gov/articles/PMC11909971/
  8. Artificial intelligence in drug development – PubMed, 5월 26, 2025에 액세스, https://pubmed.ncbi.nlm.nih.gov/39833407/
  9. Enhancing preclinical drug discovery with artificial intelligence, 5월 26, 2025에 액세스, https://pubmed.ncbi.nlm.nih.gov/34838731/
  10. Unlocking the Future of Medicine: The Role of AI in Drug Discovery, 5월 26, 2025에 액세스, https://natlawreview.com/article/unlocking-future-medicine-role-ai-drug-discovery
  11. Artificial intelligence in drug development: reshaping the therapeutic landscape – PubMed, 5월 26, 2025에 액세스, https://pubmed.ncbi.nlm.nih.gov/40008227/
  12. Will AI revolutionize drug development? Researchers explain why it depends on how it’s used, 5월 26, 2025에 액세스, https://jheor.org/post/2904-will-ai-revolutionize-drug-development-researchers-explain-why-it-depends-on-how-it-s-used
  13. How AI is Transforming New Drug Discovery – Medelis, 5월 26, 2025에 액세스, https://medelis.com/how-ai-is-transforming-new-drug-discovery/
  14. Reprogramming the Rules: How AI Is Transforming De Novo Protein Design in Drug Development – Pharma’s Almanac, 5월 26, 2025에 액세스, https://www.pharmasalmanac.com/articles/reprogramming-the-rules-how-ai-is-transforming-de-novo-protein-design-in-drug-development
  15. Opinion: AI Enables Companies to Break From the Herd in Drug Development – BioSpace, 5월 26, 2025에 액세스, https://www.biospace.com/drug-development/opinion-ai-enables-companies-to-break-from-the-herd-in-drug-development
  16. 인공지능 기반 단백질 설계 플랫폼 개발 동향 – 재능넷, 5월 26, 2025에 액세스, https://www.jaenung.net/tree/10280
  17. Protein engineering in the deep learning era – PMC, 5월 26, 2025에 액세스, https://pmc.ncbi.nlm.nih.gov/articles/PMC11685842/
  18. Opportunities and challenges in design and optimization of protein function – PMC, 5월 26, 2025에 액세스, https://pmc.ncbi.nlm.nih.gov/articles/PMC7616297/
  19. Protein design – Wikipedia, 5월 26, 2025에 액세스, https://en.wikipedia.org/wiki/Protein_design
  20. Recent advances in automated protein design and its future challenges – PMC, 5월 26, 2025에 액세스, https://pmc.ncbi.nlm.nih.gov/articles/PMC6002944/
  21. AI 신약 개발에서 단백질 유연성이 중요한 이유, 5월 26, 2025에 액세스, https://hyperlab.hits.ai/blog/ai-drug-discovery-protein-flexibility
  22. Protein design via deep learning – PMC, 5월 26, 2025에 액세스, https://pmc.ncbi.nlm.nih.gov/articles/PMC9116377/
  23. Highly accurate protein structure prediction with AlphaFold – PubMed, 5월 26, 2025에 액세스, https://pubmed.ncbi.nlm.nih.gov/34265844/
  24. AlphaFold Protein Structure Database in 2024: providing structure coverage for over 214 million protein sequences – PubMed, 5월 26, 2025에 액세스, https://pubmed.ncbi.nlm.nih.gov/37933859/
  25. Emerging frontiers in protein structure prediction following the AlphaFold revolution – PMC, 5월 26, 2025에 액세스, https://pmc.ncbi.nlm.nih.gov/articles/PMC11999738/
  26. Protein structure prediction via deep learning: an in-depth review – PMC, 5월 26, 2025에 액세스, https://pmc.ncbi.nlm.nih.gov/articles/PMC12003282/
  27. Latest progress and tools for de novo generation of peptides – Ardigen, 5월 26, 2025에 액세스, https://ardigen.com/latest-progress-and-tools-for-de-novo-generation-of-peptides/
  28. AI In Action: Redefining Drug Discovery and Development – PMC, 5월 26, 2025에 액세스, https://pmc.ncbi.nlm.nih.gov/articles/PMC11800368/
  29. How AI is Redefining Protein-Based Therapeutics – Kybora, 5월 26, 2025에 액세스, https://kybora.com/how-ai-is-redefining-protein-based-therapeutics/
  30. (PDF) AI in Drug Discovery & Development Introduction: AI in Drug Discovery -Addressing Rising R&D Costs and High Failure Rates – ResearchGate, 5월 26, 2025에 액세스, https://www.researchgate.net/publication/391487880_AI_in_Drug_Discovery_Development_Introduction_AI_in_Drug_Discovery_-Addressing_Rising_RD_Costs_and_High_Failure_Rates
  31. AI-guided pipeline for protein–protein interaction drug discovery identifies a SARS-CoV-2 inhibitor | Molecular Systems Biology – EMBO Press, 5월 26, 2025에 액세스, https://www.embopress.org/doi/10.1038/s44320-024-00019-8
  32. Institute for Protein Design, 5월 26, 2025에 액세스, https://www.ipd.uw.edu/
  33. [2024 노벨상] AI 신약 개발, 한국 기업들도 뛴다 – 조선일보, 5월 26, 2025에 액세스, https://www.chosun.com/economy/science/2024/10/09/Q6HQOQNWA4557P4W7HG73FMHEQ/
  34. From Data to Drugs: The Role of Artificial Intelligence in Drug Discovery – Wyss Institute, 5월 26, 2025에 액세스, https://wyss.harvard.edu/news/from-data-to-drugs-the-role-of-artificial-intelligence-in-drug-discovery/
  35. Ethical Challenges of Artificial Intelligence in Medicine – PMC, 5월 26, 2025에 액세스, https://pmc.ncbi.nlm.nih.gov/articles/PMC11670736/
  36. Scalable protein design using optimization in a relaxed sequence …, 5월 26, 2025에 액세스, https://pmc.ncbi.nlm.nih.gov/articles/PMC11734486/
  37. Robust deep learning-based protein sequence design using ProteinMPNN – PubMed, 5월 26, 2025에 액세스, https://pubmed.ncbi.nlm.nih.gov/36108050/
  38. Rewiring protein sequence and structure generative models to …, 5월 26, 2025에 액세스, https://pmc.ncbi.nlm.nih.gov/articles/PMC11870403/
  39. AI in drug discovery: Key trends shaping therapeutics in 2025 – Gubra, 5월 26, 2025에 액세스, https://www.gubra.dk/blog/ai-in-drug-discovery-key-trends-shaping-therapeutics-in-2025/
  40. Deep generative model for protein subcellular localization prediction …, 5월 26, 2025에 액세스, https://pmc.ncbi.nlm.nih.gov/articles/PMC11986326/
  41. Artificial Intelligence in Drug Discovery Market Outlook Report 2025-2030 – GlobeNewswire, 5월 26, 2025에 액세스, https://www.globenewswire.com/news-release/2025/05/08/3076995/28124/en/Artificial-Intelligence-in-Drug-Discovery-Market-Outlook-Report-2025-2030-Accelerating-Drug-Discovery-as-Pharma-Embraces-Machine-Learning-and-Data-Driven-Innovations.html
  42. Generative AI in Drug Discovery: Applications and Market Impact – DelveInsight, 5월 26, 2025에 액세스, https://www.delveinsight.com/blog/generative-ai-drug-discovery-market-impact
  43. Optimizing Lead Compounds: The Role of Artificial Intelligence in …, 5월 26, 2025에 액세스, https://www.preprints.org/manuscript/202404.0055/v1
  44. AI-powered therapeutic target discovery – PubMed, 5월 26, 2025에 액세스, https://pubmed.ncbi.nlm.nih.gov/37479540/
  45. AI in Antibody Discovery – MAbSilico, 5월 26, 2025에 액세스, https://www.mabsilico.com/news/ai-in-antibody-discovery
  46. How does AI assist in target identification and validation in drug development?, 5월 26, 2025에 액세스, https://synapse.patsnap.com/article/how-does-ai-assist-in-target-identification-and-validation-in-drug-development
  47. Deep Lead Optimization: Leveraging Generative AI for Structural Modification – PubMed, 5월 26, 2025에 액세스, https://pubmed.ncbi.nlm.nih.gov/39499822/
  48. Machine Learning for Toxicity Prediction Using Chemical Structures: Pillars for Success in the Real World – PubMed Central, 5월 26, 2025에 액세스, https://pmc.ncbi.nlm.nih.gov/articles/PMC12093382/
  49. Multimodal AI predicts clinical outcomes of drug combinations from preclinical data – arXiv, 5월 26, 2025에 액세스, https://arxiv.org/html/2503.02781v1
  50. Artificial intelligence is impacting the field – American Psychological Association, 5월 26, 2025에 액세스, https://www.apa.org/monitor/2025/01/trends-harnessing-power-of-artificial-intelligence
  51. AI Proteins to Present Key Advances in Miniprotein Therapeutics Development at PEGS Boston 2025 – Business Wire, 5월 26, 2025에 액세스, https://www.businesswire.com/news/home/20250506477411/en/AI-Proteins-to-Present-Key-Advances-in-Miniprotein-Therapeutics-Development-at-PEGS-Boston-2025
  52. Revolutionizing AI-Driven Peptide Therapeutics Strengthening Pipeline for Next-Generation Drug Discovery Based on Research at the Hebrew University, 5월 26, 2025에 액세스, https://www.afhu.org/2025/01/09/revolutionizing-ai-driven-peptide-therapeutics-strengthening-pipeline-for-next-generation-drug-discovery-based-on-research-at-the-hebrew-university/
  53. Absci Doses First Participants in Phase 1 Trial of AI-Designed Antibody for IBD, 5월 26, 2025에 액세스, https://www.biopharmatrend.com/post/1247-absci-doses-first-participants-in-phase-1-trial-of-ai-designed-antibody-for-ibd/
  54. Absci and AMD Announce Collaboration and Strategic Investment to Accelerate the Future of AI Drug Discovery, 5월 26, 2025에 액세스, https://investors.absci.com/news-releases/news-release-details/absci-and-amd-announce-collaboration-and-strategic-investment/
  55. LLM을 넘어서: 단백질 설계 AI 시대의 개막 – 하이퍼랩, 5월 26, 2025에 액세스, https://hyperlab.hits.ai/blog/Protein_Design_AI
  56. Biomatter | Protein Architects, 5월 26, 2025에 액세스, https://biomatter.ai/
  57. Alphabet’s AI biotech Isomorphic Labs hauls in $600M to power next-gen drug design model, 5월 26, 2025에 액세스, https://www.fiercebiotech.com/biotech/ai-biotech-isomorphic-labs-hauls-600m-power-next-gen-drug-design-model
  58. Beyond Legacy Tools: Defining Modern AI Drug Discovery for 2025 and Beyond, 5월 26, 2025에 액세스, https://www.biopharmatrend.com/ai-drug-discovery-pipeline-2024/
  59. AI를 활용한 혁신 신약개발의 동향 및 정책 시사점, 5월 26, 2025에 액세스, https://www.kistep.re.kr/boardDownload.es?bid=0031&list_no=94091&seq=1
  60. North America AI in Pharma & Biotech Market Size, Share [2032] – Fortune Business Insights, 5월 26, 2025에 액세스, https://www.fortunebusinessinsights.com/north-america-ai-in-pharma-biotech-market-112084
  61. 2025년에도 주목받는 AI · CDMO 시장동향 – 한국제약바이오협회, 5월 26, 2025에 액세스, https://www.kpbma.or.kr/library/trend/market/select/208809
  62. 투자 혹한기 맞은 AI신약개발 바이오텍들…AI헬스케어로 성공하려면 – 팜이데일리, 5월 26, 2025에 액세스, https://pharm.edaily.co.kr/news/read?newsId=01184086642133496
  63. Full article: Explicating the transformative role of artificial intelligence in designing targeted nanomedicine, 5월 26, 2025에 액세스, https://www.tandfonline.com/doi/full/10.1080/17425247.2025.2502022?src=
  64. Regulating the AI-enabled ecosystem for human therapeutics – PMC, 5월 26, 2025에 액세스, https://pmc.ncbi.nlm.nih.gov/articles/PMC12085592/
  65. 단백질 구조 예측을 위한 신경망: 단백질 마케팅: 구조 예측을 위해 AI 활용 – FasterCapital, 5월 26, 2025에 액세스, https://fastercapital.com/ko/content/%EB%8B%A8%EB%B0%B1%EC%A7%88-%EA%B5%AC%EC%A1%B0-%EC%98%88%EC%B8%A1%EC%9D%84-%EC%9C%84%ED%95%9C-%EC%8B%A0%EA%B2%BD%EB%A7%9D–%EB%8B%A8%EB%B0%B1%EC%A7%88-%EB%A7%88%EC%BC%80%ED%8C%85–%EA%B5%AC%EC%A1%B0-%EC%98%88%EC%B8%A1%EC%9D%84-%EC%9C%84%ED%95%B4-AI-%ED%99%9C%EC%9A%A9.html
  66. Responsible AI in biotechnology: balancing discovery, innovation and biosecurity risks, 5월 26, 2025에 액세스, https://www.frontiersin.org/journals/bioengineering-and-biotechnology/articles/10.3389/fbioe.2025.1537471/full
  67. 글로벌 AI 신약개발 시장 전망 : 네이버 블로그, 5월 26, 2025에 액세스, https://blog.naver.com/drryuhk/223829355283?fromRss=true&trackingCode=rss
  68. Protein Engineering Market Revenue to Attain USD 17.83 Bn by 2033, 5월 26, 2025에 액세스, https://www.precedenceresearch.com/press-release/protein-engineering-market
  69. AI in Pharma and Biotech: Market Trends 2025 and Beyond – Coherent Solutions, 5월 26, 2025에 액세스, https://www.coherentsolutions.com/insights/artificial-intelligence-in-pharmaceuticals-and-biotechnology-current-trends-and-innovations
  70. Protein Engineering Market Outlook Report 2025-2030: Applications in Healthcare and Agriculture for Sustainable Practices and Biofortification Present Lucrative Opportunities – GlobeNewswire, 5월 26, 2025에 액세스, https://www.globenewswire.com/news-release/2025/05/21/3085568/0/en/Protein-Engineering-Market-Outlook-Report-2025-2030-Applications-in-Healthcare-and-Agriculture-for-Sustainable-Practices-and-Biofortification-Present-Lucrative-Opportunities.html

답글 남기기