네이버클라우드와 카이스트가 발표한 '한국 교육 표준을 이용한 멀티모달 생성형 AI 평가' 논문에 따르면, AI 모델들은 수능 문제에 대해 어려움을 겪고 있는 것으로 나타났습니다. GPT-4o, 제미나이 1.5 프로, 하이퍼클로바X 등의 AI 모델들이 사용되었으며, 이들은 수능 문제를 해결하는 데 어려움을 겪었습니다.
특히 국어 영역에 대해 AI가 반응한 결과를 살펴보면, 지문의 길이가 길고 논리 수준이 높은 추론형 문항이 많았다고 합니다. 또한, 어려운 문제로 독서에서 8번 문항이 언급되었는데, 해당 문항은 지문을 넘나드는 복합적인 추론이 필요한 문제였습니다.
수험생들은 AI가 풀지 못한 수능 영어 34번 문제를 비난하며 "악마의 문항"이라고 토로하기도 했습니다. 이에 출제 본부에서는 올해의 영어 영역이 작년 수능 및 올해 9월 모의 평가와 유사한 출제 기조를 가졌다고 설명했습니다.
또한, 연세대와 서울대에서도 온라인 시험에서 AI를 활용한 부정행위가 발견되었습니다. 이러한 문제가 발생한 것은 우리나라뿐만이 아니라 중국에서도 수능에서 AI를 활용한 부정행위가 발생했던 사례가 있습니다.
한편, 수능 시험이 5.4 강진으로 인해 사상 첫 긴급 연기를 결정한 바 있습니다. 이로 인해 59만 3527명의 수험생들뿐만 아니라 수능 문제를 준비해 온 출제 위원들까지 영향을 받았습니다.
이와 같은 상황에서 임태희 경기교육감은 수능 영어 듣기평가의 폐지를 제안하며 대입 제도의 개선을 촉구하고 있습니다. 경기도교육청은 AI를 활용한 서·논술 평가 시스템을 테스트 중이며, 이를 통해 수능의 개편과 내신 평가 방식의 변화가 이루어지고 있습니다.
인공지능(AI) 모델들을 활용한 수능 문제풀이 결과를 살펴보면, 챗GPT(GPT-5), 제미나이(2.5 플래시), 퍼플렉시티(소나), 딥시크 등의 최신 모델들이 사용되었고, 이들은 2026년도 수능 국어·영어·수학 영역을 풀어보며 결과를 도출했습니다.
위의 내용에서, AI가 수능 문제를 어려워하는 결과가 나타났으며, 수험생들과 교육당국 간에 이에 대한 관심과 논의가 지속되고 있음을 알 수 있습니다.부분에 대한 내용을 상기하고, AI가 수능 문제를 푸는 데 어려움을 겪고 있다는 사실, 수능 영어 문제 중 일부가 어렵다는 점, 학생들이 AI를 활용한 부정행위에 대한 우려, 수능 시험 연기로 인한 혼란, 그리고 대입 제도 개편 등의 문제에 대해 다뤘습니다. 또한, 인공지능(AI) 모델을 활용한 수능 문제풀이 결과와 관련하여 챗GPT(GPT-5), 제미나이(2.5 플래시), 퍼플렉시티(소나), 딥시크 등의 모델을 언급하였습니다.
AI 수능 문제의 검색 데이터 요약입니다.
데이터가 보이지 않는 경우 아래 버튼으로 실시간 조회가 가능합니다.
| PC | 모바일 | PC+모바일 | 블로그 수 | 기준일 |
|---|---|---|---|---|
| 검색량 확인하기 | ||||