구글 딥마인드의 멀티 에이전트 파인튜닝 기술 - 인간에게 학습 데이터를 의존하지 않는 AI의 자기 개선 시스템 현대의 대형 언어 모델은 놀라운 성능을 발휘하고 있지만 근본적으로 학습된 데이터에 의해 제한되고 있습니다. 게다가 유용한 데이터는 점차 고갈되어 감에 따라 모델을 개선하기 위한 방법으로 '스스로 데이터를 생성해 학습하는 자기 개선(self-improvement)'이 주 contents.premium.naver.com 현대의 대형 언어 모델은 놀라운 성능을 발휘하고 있지만 근본적으로 학습된 데이터에 의해 제한되고 있습니다.
게다가 유용한 데이터는 점차 고갈되어 감에 따라 모델을 개선하기 위한 방법으로 '스스로 데이터를 생성해 학습하는 자기 개선(self-improvement)'이 주목받아 왔습니다. 그러나 기존의 자기 개선 방법들은 반복적인 학습 과정에서 ‘데이터 다양성’이 점차 줄어들어 성능이 정체되고, 때문에 이를 몇 라운드 이상 이어가기 어렵다는 문제가 있었습니다.
결과...