로딩
요청 처리 중입니다...

Text-image Alignment for Diffusion-based Perception

 Text-image Alignment for Diffusion-based Perception

Confernece : CVPR24 Paper briefly review. Research objective : Can Diffusion models adapt to new domain well?

저자들은 Pretrained Diffusion model을 cross-domain task에서 사용하는 방법을 제안합니다. 이는 실제 데이터를 활용해서 detection, segmentation, depth estimation 등을 수행하는 것과 유사하게 동작합니다.

실제로 위 figure에서는 다른 도메인의 이미지이지만 object는 동일한 것을 보고 있는데, 이를 잘 활용해서 사용해볼 수 있을 것 같습니다. we focus on cross-domain adaptation: can appropriate image captioning help visual perception when the model is trained in one domain and tested on a different...

# BLIP # Timestep # TextualInversion # TADP # T2I # Null # Hyperfeatus # DreamBooth # DomainAdaptation # DiffusionPerception # DiffusionFeatures # DiffusionDenoise # DiffusionBased # Diffusion # DenoisedStep # CVPR # CrossDomainAdaptation # CrossAttention # VLM