https://kk-eezz.tistory.com/109 An Introduction to Vision-Language Modeling 논문 요약 https://arxiv.org/pdf/2405.17247 목차1. Introduction2.
The Families of VLMs3. A Guide to VLM Training4.
Extending VLMs to Videos 1. IntroductionVision Language Model이란?
“In simple terms, a VLM can understand images and text jointly and relate them together” VLM은 단순히 정의하면, 영상과 텍스트를 결합하여 이해하고 연관 지을 수 ... kk-eezz.tistory.com...
원문 링크 : 잘 정리 되어있는 VLM 관련 내용 링크