카테고리
과학탐구 면접대비 생명과학 실험 실습 탐구 통합과학

[단백질 구조 분석] EGFR_AF3 구조 모델 비교 평가: hanjarifold의 정밀도 분석

AlphaFold3(AF3)를 활용한 단백질 구조 예측에서 모델의 신뢰성을 확보하는 것은 매우 중요합니다. 오늘은 EGFR 구조 모델인 ‘EGFR_AF3_hanjarifold’와 기존 ‘EGFR_AF3’ 모델의 MolProbity 수치를 비교하여, 어떤 모델이 물리적으로 더 타당한 구조를 갖추고 있는지 분석해 보겠습니다.

1. 종합 평가 지표: MolProbity Score 및 Percentile

가장 먼저 확인해야 할 지표는 구조의 전반적인 품질을 나타내는 MolProbity Score입니다. 이 점수는 낮을수록 고해상도 결정 구조에 가까운 우수한 품질을 의미합니다.

평가 항목 EGFR_AF3 (기본) EGFR_AF3_hanjarifold 비고
MolProbity Score 1.51 1.13 hanjarifold 우세
Percentile 95th 99th 전 세계 구조 중 상위 1% 수준

hanjarifold 모델은 1.13점을 기록하며 기본 모델(1.51)보다 유의미하게 낮은 점수를 보였습니다. 특히 백분위(Percentile) 기준 상위 1%에 해당하는 99th percentile을 기록하여 매우 높은 완성도를 보여줍니다.


2. 원자 간 충돌 지수: Clashscore

Clashscore는 1,000개의 원자당 비결합 원자들 사이의 비정상적인 겹침(steric overlap)이 발생하는 횟수를 측정합니다.

  • EGFR_AF3: 5.08 (93rd percentile)

  • EGFR_AF3_hanjarifold: 1.88 (99th percentile)

hanjarifold의 Clashscore는 1.88로, 기본 모델(5.08) 대비 충돌 빈도가 현저히 낮습니다. 이는 분자 내부의 원자 배치가 훨씬 더 자연스럽고 안정적임을 뜻합니다.


3. 단백질 기하학적 타당성 (Protein Geometry)

아미노산 잔기의 각도와 결합 상태를 나타내는 지표들에서도 차이가 나타납니다.

  • Ramachandran Outliers (라마찬드란 이상치):

    • 기본 모델은 2개(0.61%)의 이상치가 발견되었으나, hanjarifold는 0개(0.00%)로 모든 잔기가 허용된 각도 범위 내에 존재합니다.

  • Rotamer Outliers (로타머 이상치):

    • 두 모델 모두 0개로 우수한 결과를 보였으나, Favored Rotamers(선호되는 로타머) 비율에서 미세한 차이를 보입니다.

  • Bad Bonds / Bad Angles:

    • 기본 모델은 3개의 Bad angles가 발견된 반면, hanjarifold는 결합 길이와 각도 모두에서 결함이 전혀 발견되지 않았습니다 (0/2680, 0/3629).


4. 저해상도 기준 및 추가 검증 (Low-resolution Criteria)

C-alpha 결합의 기하학적 구조를 평가하는 CaBLAMCA Geometry 수치입니다.

  • CaBLAM outliers: 기본 모델(0.9%) 대비 hanjarifold(1.2%)가 소폭 높으나, 두 모델 모두 목표치인 1.0% 내외로 양호합니다.

  • Chiral volume outliers: 두 모델 모두 0개로, 카이랄성 오류가 없는 깨끗한 데이터를 보여줍니다.


결론: hanjarifold 모델의 압승

데이터를 종합해 볼 때, EGFR_AF3_hanjarifold 모델은 다음과 같은 강점을 가집니다.

  1. 극한의 정밀도: Clashscore와 MolProbity Score에서 압도적인 수치를 기록함.

  2. 물리적 무결성: 이상 결합(Bad bonds)이나 이상 각도(Bad angles)가 전혀 없는 완벽한 기하 구조를 형성함.

  3. 신뢰도 확보: 전체 구조 중 상위 1%에 해당하는 99th percentile을 달성하여 분석용 모델로서의 가치가 매우 높음.

결과적으로, 정밀한 도킹 시뮬레이션이나 분자 역학 분석을 진행한다면 hanjarifold 모델을 사용하는 것이 훨씬 더 객관적이고 신뢰도 높은 결과를 도출할 수 있을 것으로 판단됩니다.

>AF3_328

SGEAPNQALLRILKETEFKKIKVLGSGAFGTVYKGLWIPEGEKVKIPVAIKELREATSPKANKEILDEAYVMASVDNPHVCRLLGICLTSTVQLITQLMPFGCLLDYVREHKDNIGSQYLLNWCVQIAKGMNYLEDRRLVHRDLAARNVLVKTPQHVKITDFGLAKLLGAEEKEYHAEGGKVPIKWMALESILHRIYTHQSDVWSYGVTVWELMTFGSKPYDGIPASEISSILEKGERLPQPPICTIDVYMIMVKCWMIDADSRPKFRELIIEFSKMARDPQRYLVIQGDERMHLPSPTDSNFYRALMDEEDMDDVVDADEYLIPQQG

[단백질 구조 분석] EGFR_AF3 구조 모델 비교 평가: hanjarifold의 정밀도 분석

답글 남기기