저는 ESMFold2를 통해 최신 단백질 AI 연구의 핵심 흐름을 정리합니다. 이 모델은 단백질의 아미노산 서열만으로 3차원 구조를 예측할 뿐 아니라 새로운 치료용 단백질 설계까지 가능하게 하는 AI입니다. 연구진은 이를 단순한 구조 예측기를 넘어 단백질 생물학의 월드모델이라고 설명합니다. 즉 단백질이 어떻게 생기고 어떻게 작동하며 서로 어떻게 상호작용하는지에 관한 규칙을 학습하려는 것이지요.
먼저 ESMC는 약 28억 개의 단백질 서열을 학습한 60억 개 파라미터의 단백질 언어 모델입니다. 인터넷 문서를 읽듯이 데이터에서 생물학의 규칙을 스스로 체득했다는 점이 흥미롭습니다. 크기가 커질수록 성능이 향상되는 확장 법칙도 확인됩니다. 다음으로 ESM Atlas는 약 68억 개의 서열과 11억 개의 구조 예측 정보를 담은 초대규모 데이터베이스로, 단순 저장소를 넘어 생명체 전반의 단백질 지도 역할을 한다고 봅니다. 이를 통해 CRISPR 관련 단백질 간의 관계를 스스로 찾아내고, 진화적으로 멀리 떨어져 보이는 단백질이 비슷한 기능을 수행한다는 사실까지 발견되었다고 전합니다. 이는 앞으로 유전자 편집 도구나 신약 표적 탐색에 중요한 활용 가능성을 열어 줍니다.
또 ESMFold2는 기존 AlphaFold 계열이 주로 MSA를 활용하는 반면, ESMC가 축적한 지식을 직접 활용해 구조를 예측합니다. 매번 참고서를 찾기보다 내부적으로 학습한 생물학 지식을 바탕으로 작동하는 것이죠. 항체-항원 결합 예측에서도 약 55%의 정확도를 기록했고, 특정 벤치마크에선 AlphaFold 3를 넘어서는 경우도 있습니다. 일반적인 단백질-단백질 상호작용에서도 서열만으로 71%, 여기에 MSA를 더하면 77%의 업계 최고 수준의 정확도를 달성합니다.
새로운 단백질 설계 연구에서도 실제로 미니바인더와 단일사슬 항체를 설계했고, 표적이 되는 EGFR·PDGFRβ·PD-L1·CTLA-4·CD45 등 여러 항암제 표적에서 실험적으로 검증했습니다. 후보 생성은 약 2일, 평가에 하루를 넘지 않았고, 컴퓨팅 투입을 늘릴수록 미니바인더의 성공률이 54%에서 70%로, scFv는 12%에서 21%로 크게 향상되었습니다. 선별된 단백질은 실험실에서 강한 결합력과 높은 안정성을 보였으며, PD-L1 표적의 경우 4.3 nM의 강한 결합력을 가진 단일사슬 항체 설계가 가능했습니다. 세포 실험에서도 암세포의 면역 회피 신호를 차단하는 효과를 확인했습니다. EGFR 표적에서는 cryo-EM으로 실제 결합 구조를 촬영해 예측과 거의 일치하는 결과를 얻었습니다.
결론적으로, ESMFold2는 단지 구조를 예측하는 것을 넘어 생물학적 규칙을 이해하고 이를 바탕으로 실제 치료 후보를 설계하는 강력한 도구로 자리매김하고 있습니다.
#
AI
#
인공지능
#
알파폴드
#
생물학
#
바이오
#
미국주식
#
메타
#
마크저커버그
#
ESMFold2
#
AI항체설계
#
AI신약개발
#
AI생물학
#
AI바이오
#
AI단백질설계
#
한국주식