최근 OpenAI 연구원들의 논문은 대형 언어 모델(LLM)이 “환각(hallucination)”, 즉 사실이 아닌 정보를 만들어내는 이유에 대해 새로운 통찰을 제공한다. 이 논문에 따르면, 주요 AI 기업들이 사용하는 평가 방식이 오히려 과도한 자신감을 유도한다고 한다.
성능 테스트는 종종 객관식 질문 형태로 구성되며, 명확한 정답이 주어져 있어서 모델이 확신이 없을 때 답변을 피하기보다는 추측으로 답하도록 유도하는 경향이 있다. 이러한 평가에서 높은 점수를 얻도록 시스템을 최적화함으로써, AI 기업들은 실제로 정확도를 향상시키기보다는 단지 ‘시험 잘 보는 모델’을 훈련시키는 셈이 된다.
생성형 AI를 뉴스 제작에 책임감 있게 활용하는 방법을 탐구합니다. 오스트리아 언론사 **APA(The Austrian Press Agency)**는 생성형 AI를 사용해 인포그래픽에 대한 설명 텍스트를 생성합니다.
Clare Spencer 저널리즘에서 인간 중심 기술을 위한 작은 도구 프레임워크...