요청 처리 중입니다...

CUDA out of memory

2025-02-13 09:54:21

안녕하세요~ 오늘 포스팅은 사용 중인 GPU의 메모리 용량이 현재 작업에 필요한 메모리를 초과했을 때 발생하는 오류를 해결하는 방법에 대해서 알아보겠습니다. 오류 내용 Hugging Face의 Google Gemma 모델을 불러올 때 다음과 같은 오류 메시지가 나타납니다.

BASE_MODEL = 'google/gemma-2b-it' model = AutoModelForCausalLM.from_pretrained(BASE_MODEL, device_map={'':0}) tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL, add_special_tokens=True) . . . File /usr/local/lib/python3.8/dist-packages/transformers/modeling_utils.py:3502, in PreTrainedModel.from_pretrained(cls, pretrained_model_name_or_path, ...

# AI # MLOps방법론 # MLOps # Kubeflow오류 # GPU메모리오류 # AI프레임워크 # AI파이프라인자동화 # AI파이프라인구축 # AI워크플로우 # AI백엔드기술 # AI모델자동화 # AI모델생애주기 # AI모델구축 # AI모델개발 # MLOps오류

원문 링크 : CUDA out of memory

등록된 다른 글

멀티 노드 클러스터 : K8S Dashboard 설치

[건강] 나의 헬스 일지 : 2022.08.01 ~ 2022.08.07

[일본 여행] 아소 '다이칸보 전망대'에 가다

RDKit으로 SMILES 분자 구조를 확인하는 방법은?

BentoML에서 KFP를 사용하는 방법: Python의 Print 함수 예제

네이버 블로그 해피빈 인증 이벤트