로딩
요청 처리 중입니다...

CUDA out of memory

 CUDA out of memory

안녕하세요~ 오늘 포스팅은 사용 중인 GPU의 메모리 용량이 현재 작업에 필요한 메모리를 초과했을 때 발생하는 오류를 해결하는 방법에 대해서 알아보겠습니다. 오류 내용 Hugging Face의 Google Gemma 모델을 불러올 때 다음과 같은 오류 메시지가 나타납니다.

BASE_MODEL = 'google/gemma-2b-it' model = AutoModelForCausalLM.from_pretrained(BASE_MODEL, device_map={'':0}) tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL, add_special_tokens=True) . . . File /usr/local/lib/python3.8/dist-packages/transformers/modeling_utils.py:3502, in PreTrainedModel.from_pretrained(cls, pretrained_model_name_or_path, ...

# AI # MLOps방법론 # MLOps # Kubeflow오류 # GPU메모리오류 # AI프레임워크 # AI파이프라인자동화 # AI파이프라인구축 # AI워크플로우 # AI백엔드기술 # AI모델자동화 # AI모델생애주기 # AI모델구축 # AI모델개발 # MLOps오류

원문 링크 : CUDA out of memory