생성형 AI 기술의 발전과 함께 업무에 생성형 AI를 적극적으로 활용하고자 하는 수요가 가파르게 늘어나고 있다. 특히 Google의 Gemini Pro 2.0이나 OpenAI의 o3와 같이 인간 수준의 추론 능력과 문장력을 자랑하는 기초모델(Foundation Model)이 등장하면서 이제 생성형 AI 활용 능력이 개인과 조직의 경쟁력을 결정짓는 핵심적인 기술중 하나로 자리잡고 있는 것이다.
사전적 정의에 따르면 기초모델이란 글쓰기, 코딩, 이미지 등 다양한 생성(Generative) 작업을 수행할 수 있도록 훈련된 초거대 인공지능 모델을 가리킨다. 주로 텍스트 데이터를 다루는 기초모델들은 우리에게 초거대언어모델(LLM)이라는 말로 더욱 친숙하다.
하지만 이 LLM을 원하는 작업(task)에 맞게 활용하는 것은 결코 쉬운일이 아니다. 이미 사전학습(Pre-trained)된 모델을 원하는 도메인 지식과 태스크에 맞게 추가로 훈련시키는 과정인 미세조정(Fine-tuning)과, 답변의 ...