안녕하세요~ 오늘 포스팅은 사용 중인 GPU의 메모리 용량이 현재 작업에 필요한 메모리를 초과했을 때 발생하는 오류를 해결하는 방법에 대해서 알아보겠습니다. 오류 내용 Hugging Face의 Google Gemma 모델을 불러올 때 다음과 같은 오류 메시지가 나타납니다.
BASE_MODEL = 'google/gemma-2b-it' model = AutoModelForCausalLM.from_pretrained(BASE_MODEL, device_map={'':0}) tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL, add_special_tokens=True) . . . File /usr/local/lib/python3.8/dist-packages/transformers/modeling_utils.py:3502, in PreTrainedModel.from_pretrained(cls, pretrained_model_name_or_path, ...
#
AI
#
MLOps방법론
#
MLOps
#
Kubeflow오류
#
GPU메모리오류
#
AI프레임워크
#
AI파이프라인자동화
#
AI파이프라인구축
#
AI워크플로우
#
AI백엔드기술
#
AI모델자동화
#
AI모델생애주기
#
AI모델구축
#
AI모델개발
#
MLOps오류
원문 링크 : CUDA out of memory