저는 EXAONE Path 2.5를 통해 기존 병리 AI가 암 조직의 결과물만 학습하는 한계를 넘어, 암의 원인까지 이해하려는 시도를 제시합니다. 기존 접근은 현미경 이미지에서 암의 종류나 특징을 포착했지만, 실제 암은 유전자 돌연변이에서 시작해 DNA 메틸화, RNA 발현 변화로 연결되고, 결국 세포와 조직 모양이 바뀌는 전체 흐름을 보며 학습해야 한다는 점을 강조합니다. 유전형에서 표현형으로의 연결을 핵심으로 삼아, 특정 유전자 변화가 RNA 패턴과 단백질 생산, 세포 기능, 암 조직의 모양까지 어떻게 영향을 주는지 하나의 모델 안에서 학습하려고 합니다.
다양한 생물학 데이터의 학습에 저는 환자 23,099명의 병리 슬라이드 23,099개, RNA‑seq 샘플 29,876개, SNP 샘플 10,250개, CNV 샘플 10,601개, DNA 메틸화 샘플 10,503개를 함께 연결해 활용했습니다. 서로 다른 데이터 타입을 독립적으로 보는 대신 하나의 암에서 발생한 여러 현상을 연계해 이해하도록 설계했습니다. 모델은 Multimodal SigLIP Loss를 통해 병리 이미지와 RNA, 병리 이미지와 DNA 메틸화, RNA와 SNP, SNP와 CNV 등 다양한 관계를 동시에 학습해 생물학적 관계까지 파악할 수 있게 했습니다.
저는 병리 이미지를 작은 타일로 나눠 분석하되 원래 위치 정보를 잃지 않도록 F‑RoPE(Fragment‑Aware Rotary Position Encoding)를 적용했습니다. 이를 통해 면역세포의 종양 주변 위치나 특정 암 영역의 분포 같은 공간 생물학적 정보를 더 정확히 활용합니다. 또한 병리 이미지는 시각 데이터이고 RNA‑seq는 수치 데이터인 점을 고려해 먼저 각각의 파운데이션 모델로 학습한 뒤 두 모델을 연결하는 멀티모달 정렬 방식을 택했습니다. 이를 통해 멀티모달 연결의 안정성을 높였습니다.
평가에서는 내부 데이터와 Patho‑Bench 벤치마크에서 평균 AUROC 0.7675를 기록했고, TITAN, PRISM, GigaPath 등 글로벌 모델과 비슷하거나 더 높은 수준의 성능을 확인했습니다. 더 주목할 점은 더 적은 데이터와 더 작은 규모의 모델로도 경쟁력을 나타냈다는 점으로, 모델 크기 증가보다 암의 생물학적 구조와 인과관계를 반영한 접근이 중요하다는 시사를 제공합니다.
이 논문은 병리 AI의 목표가 과거의 단순 진단에서 벗어나, 하나의 병리 이미지 만으로도 유전자 돌연변이, 면역 상태, 치료 반응 가능성, 예후까지 예측하는 방향으로 나아가고 있음을 보여줍니다. 결국 EXAONE Path 2.5는 유전체·전사체·후성유전체·병리 이미지를 하나로 연결해 암의 원인과 결과를 함께 이해하려는 멀티오믹스 파운데이션 모델로, 알파폴드나 알파게놈, 가상 세포 같은 생물학 전체를 하나의 연결된 시스템으로 이해하려는 흐름과도 맥을 같이 합니다.
#
AI
#
토모큐브
#
인공지능
#
엑사원패스
#
엑사원
#
생물학
#
바이오
#
미국주식
#
LGAI연구원
#
LG
#
EXAONE
#
AI신약개발
#
AI생물학
#
AI바이오
#
한국주식