Deformable DETR

Defromable DETR paper 논문정리 이해를 위해 중요한 부분을 위주로 글을 나열하였습니다. 혹시나 틀린 부분이 있다면 조언 부탁드립니다 !

Summary 개인 피셜 DETR을 Deformable한 Image Feature를 통해 Attention 작업을 진행함으로써, 연산량을 줄이고 빠른 훈련이 가능하도록 만들었습니다. 연산량이 줄어들어 Multi-Scale 정보를 Resnet으로부터 가져올 수 있었으며, 다양한 SIze에서의 이미지 피쳐는 모델이 작은 객체에 대해서도 준수한 성능을 낼 수 있게끔 만들어주었습니다.

Multi-Scale 정보를 얻음으로써 생기는 각 Scale에 대한 정보를 모델이 파악할 수 있게끔 Scale Embedding 정보가 추가되었습니다. Decoder 단에서, 예측 Reference Point를 생성하기위해 학습가능한 Linear projection을 사용합니다.

여기서 나오는 예측 prediction은 BBOX의 Centor를 가르키게 되고,...

요청 처리 중입니다...

Deformable DETR

등록된 다른 글