Defromable DETR paper 논문정리 이해를 위해 중요한 부분을 위주로 글을 나열하였습니다. 혹시나 틀린 부분이 있다면 조언 부탁드립니다 !
Summary 개인 피셜 DETR을 Deformable한 Image Feature를 통해 Attention 작업을 진행함으로써, 연산량을 줄이고 빠른 훈련이 가능하도록 만들었습니다. 연산량이 줄어들어 Multi-Scale 정보를 Resnet으로부터 가져올 수 있었으며, 다양한 SIze에서의 이미지 피쳐는 모델이 작은 객체에 대해서도 준수한 성능을 낼 수 있게끔 만들어주었습니다.
Multi-Scale 정보를 얻음으로써 생기는 각 Scale에 대한 정보를 모델이 파악할 수 있게끔 Scale Embedding 정보가 추가되었습니다. Decoder 단에서, 예측 Reference Point를 생성하기위해 학습가능한 Linear projection을 사용합니다.
여기서 나오는 예측 prediction은 BBOX의 Centor를 가르키게 되고,...
#
Attetnion
#
Resnet
#
Summary
#
Transfomer
#
TransformerDetector
#
VisionTransformer
#
논문
#
논문분석
#
논문정리
#
Papers
#
Multiclass
#
jjunsss
#
ComputerVision
#
CV
#
decoder
#
Deformable
#
DeformableDETR
#
Detection
#
DETR
#
encoder
#
컴퓨터비젼
원문 링크 : Deformable DETR