로딩
요청 처리 중입니다...

앤트로픽이 말하는 AI 바이오 에이전트의 핵심: 생물학 데이터 인프라 & 하네스 엔지니어링

 앤트로픽이 말하는 AI 바이오 에이전트의 핵심: 생물학 데이터 인프라 & 하네스 엔지니어링

AI 바이오의 핵심 경쟁력은 더 똑똑한 모델을 만드는 것이라고 보는 시각이 많지만, 현재 가장 큰 문제는 모델의 지능이 아니라 생물학 데이터가 정리되고 연결되는 방식이다. 자료가 흩어져 있고 실험 기록 형식이 제각각인 상태에서 업무 효율은 크게 떨어진다. 실제 연구 현장도 이와 같은 문제 구조에 놓여 있다.

앤트로픽은 VirBench라는 평가 환경을 만들어 Claude, GPT, Biomni, Edison Analysis 같은 AI 에이전트들에게 NCBI Virus 데이터베이스에서 특정 바이러스의 유전체 데이터를 찾아오도록 했다. 바이러스 감시나 진단키트 개발, 백신 연구 등 현실 연구에서 자주 수행하는 작업이다. 이 간단한 작업에서도 모델 성능 차이가 16.9%에서 91.3%까지 크게 벌어졌다. 서로 다른 유전체 버전을 혼동하거나 데이터베이스 구분이 되지 않는 사례도 있었고, 부분 유전체를 전체 유전체로 오인하는 경우도 있었다. 즉 생물학을 이해하지 못해 생긴 문제가 아니라 데이터를 정확히 찾고 정리하는 과정에서의 오류였다.

하네스(Harness) 개념은 AI가 직접 데이터베이스를 검색하기보다 신뢰할 수 있는 도구를 통해 데이터를 얻도록 역할을 나누는 구조다. AI는 어떤 데이터를 찾을지 판단하고, 데이터 검색과 추출은 검증된 프로그램이 수행한다. 이로써 정확도가 거의 100%에 가깝게 상승한다. 하네스는 AI 모델 하나가 아니라 데이터베이스, API, 분석 소프트웨어, 검증 시스템, 실험 장비 등을 하나의 작업 흐름으로 매끄럽게 연결하는 환경을 가리킨다. 앤트로픽은 앞으로의 경쟁력이 모델 성능 자체보다 이러한 하네스를 얼마나 잘 구축하느냐에 달려 있다고 본다.

코딩 분야와 생물학의 차이는 이미 구축된 인프라의 유무에서 드러난다. 코딩 에이전트는 GitHub, 버전 관리, 자동 테스트, API 같은 인프라가 잘 갖춰져 있어 현실 업무에 빠르게 투입될 수 있었다. 반면 생물학은 기관마다 데이터 형식이 다르고 실험 결과에 노이즈가 많으며 최종 검증은 물리적 실험이 필요하다. 따라서 생물학 AI는 코딩 AI보다 훨씬 복잡한 인프라 문제를 해결해야 한다.

완전한 연구 루프를 지향하는 앤트로픽의 비전은 AI가 가설을 만들고 실험을 설계하며 자동화 실험실을 통해 실험을 진행하고 결과를 분석해 다음 실험을 다시 설계하는 자기 개선 연구 시스템이다. 즉 단순히 논문을 읽는 수준을 넘어, 가설 생성 → 실험 → 분석 → 다음 실험 설계로 이어지는 순환을 구현하는 것이 목표이다.

투자 시사점은 실제 생물학 데이터를 대규모로 확보하고 자동화 실험실과 측정 장비를 운영하며 이를 AI와 연결하는 기업의 가치가 커진다는 점이다. 이는 디지털 트윈, 단백질 구조 검증 시스템, 항체 데이터 플랫폼, Billion Cell Atlas, 단백질 상호작용 데이터, 실시간 세포 데이터 등의 흐름과도 맞닿아 있다.

# AI # 하네스엔지니어링 # 인공지능 # 앤트로픽 # 생물학데이터 # 생물학 # 바이오 # 미국주식 # AI에이전트 # AI신약개발 # AI생물학 # AI바이오 # AI데이터 # 한국주식