“AI가 진짜 저널리즘을 이해하고 있을까?”저널리즘 위한 ‘AI 벤치마크 테스트 툴’이 필요한 이유

최근 OpenAI 연구원들의 논문은 대형 언어 모델(LLM)이 “환각(hallucination)”, 즉 사실이 아닌 정보를 만들어내는 이유에 대해 새로운 통찰을 제공한다. 이 논문에 따르면, 주요 AI 기업들이 사용하는 평가 방식이 오히려 과도한 자신감을 유도한다고 한다.

성능 테스트는 종종 객관식 질문 형태로 구성되며, 명확한 정답이 주어져 있어서 모델이 확신이 없을 때 답변을 피하기보다는 추측으로 답하도록 유도하는 경향이 있다. 이러한 평가에서 높은 점수를 얻도록 시스템을 최적화함으로써, AI 기업들은 실제로 정확도를 향상시키기보다는 단지 ‘시험 잘 보는 모델’을 훈련시키는 셈이 된다.

생성형 AI를 뉴스 제작에 책임감 있게 활용하는 방법을 탐구합니다. 오스트리아 언론사 **APA(The Austrian Press Agency)**는 생성형 AI를 사용해 인포그래픽에 대한 설명 텍스트를 생성합니다.

Clare Spencer 저널리즘에서 인간 중심 기술을 위한 작은 도구 프레임워크...

요청 처리 중입니다...

“AI가 진짜 저널리즘을 이해하고 있을까?”저널리즘 위한 ‘AI 벤치마크 테스트 툴’이 필요한 이유

등록된 다른 글