안녕하세요. 요즘 회사에서 AI를 도입하고 싶은데, 보안 때문에 인터넷이 안 되는 서버에서 돌려야 하는 경우 많으시죠?
저도 실무에서 폐쇄망 서버에 Ollama를 구축하면서 삽질을 꽤 했는데요, 그 경험을 바탕으로 인터넷망에서 다운받은 Ollama 모델을 폐쇄망으로 옮기는 전체 과정을 정리해봤습니다. 이런 분들한테 도움이 될 거예요 → 금융권, 공공기관 등 망분리 환경에서 LLM을 써야 하는 개발자 → Ollama 모델을 오프라인 서버에 설치해야 하는 인프라 담당자 → 폐쇄망에 AI 도입을 검토 중인 분 글에서 다루는 내용을 간단히 요약하면 1) Ollama 바이너리 + 모델 파일을 인터넷망에서 한 번에 패키징하는 방법 2) 모델 디렉토리 구조 (manifests / blobs) 상세 설명 3) 대용량 모델 분할 전송 팁 (70B급 모델은 40GB 넘어갑니다) 4) 폐쇄망 서버에 오프라인 설치 + systemd 서비스 등록 5) 커스텀 모델(Modelfile)까지 함께 옮기는 법 6...
원문 링크 : 폐쇄망에서 Ollama 쓰는 법, 모델 통째로 옮기는 방법