GPT-5.2 압도? 클로드(Claude) Opus 4.6 출시, 15년 차가 분석한 실전 '미친' 성능 포인트

드디어 올 게 왔네요. 앤스로픽(Anthropic)에서 작정하고 클로드 Opus 4.6을 내놨더라고요.

아침부터 커뮤니티가 난리길래 저도 자료 싹 훑어보고 제가 직접 테스트해 본 결과까지 섞어서 정리해 봤어요. (솔직히 GPT-5.2 나오면 클로드가 밀릴 줄 알았는데, 이번엔 좀 다릅니다) 바쁘신 분들을 위한 핵심 요약 100만 토큰 컨텍스트: 이제 책 수십 권 분량도 안 까먹고 처리해요.

GPT-5.2 격파: 경제적 가치가 높은 지식 업무(GDPval-AA)에서 경쟁사를 압도했어요. 오피스 킬러: 엑셀은 기본이고, 이제 파워포인트(PPT) 슬라이드까지 알아서 짜주더라고요.

성능 수치? 벤치마크보다 '체감'이 무섭습니다 단순히 똑똑해졌다는 말로는 부족해요.

이번 Opus 4.6은 GDPval-AA 벤치마크에서 OpenAI의 GPT-5.2보다 144점이나 높은 Elo 점수를 기록했거든요. 금융, 법률 같은 전문 영역에서 '말만 잘하는 AI'가 아니라 진짜 '일 잘하는 동료' 수...

요청 처리 중입니다...

GPT-5.2 압도? 클로드(Claude) Opus 4.6 출시, 15년 차가 분석한 실전 '미친' 성능 포인트

등록된 다른 글