합성 데이터 시대를 대비하는 구글의 전략: 가치있는 데이터를 찾아내는 'DataRater' 기법 앞으로 인공지능이 더 고도화될수록 사람 대신 AI가 만들어내는 ‘합성 데이터’가 폭발적으로 늘어날 것이라는 전망이 많습니다. 합성 데이터는 필요할 때마다 원하는 양을 거의 무한하게 만들어낼 수 있다는 장점이 있지만, 그중 어떤 데이터가 실제 모델 학습에 정말 도움이 되 contents.premium.naver.com 앞으로 인공지능이 더 고도화될수록 사람 대신 AI가 만들어내는 ‘합성 데이터’가 폭발적으로 늘어날 것이라는 전망이 많습니다.
합성 데이터는 필요할 때마다 원하는 양을 거의 무한하게 만들어낼 수 있다는 장점이 있지만, 그중 어떤 데이터가 실제 모델 학습에 정말 도움이 되는지 판단하는 일은 점점 더 어려워지고 있습니다. 겉으로 보기에는 그럴듯한 텍스트라도 모델 입장에서는 중복이거나, 편향이 심하거나, 품질이 낮아 오히려 성능을 떨어뜨릴 수 있죠.
결국 앞으로의 시대에는 데이터의 ...