로딩
요청 처리 중입니다...

I3D - Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset

 I3D - Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset

0. Introduction 최근 Video Classification을 공부하는 도중 Two Stream 방식의 대표적인 Model을 사용해 보고자 마음 먹게되었습니다.

이번에 Review해 볼 Paper는 I3D 방식(Inflated 3D)을 제시한 것을 알아보도록 하겠습니다. 제목은 ‘Quo Vadis, Action Recognition?

A New Model and the Kinetics Dataset’이며 Link에서 확인 가능합니다. 실제 구현은 https://github.com/deepmind/kinetics-i3d에서 구할 수 있습니다. 1.

The old ones 먼저 I3D가 나오기 전에 사용하던 방식들에 대해서 알아보기로 하겠습니다. 1.1. The old 1 : ConvNet + LSTM 기존 CNN에서 사용하던 2D ConvNet을 이용하여 Video의 각 Frame마다 Feature를 뽑아내고 이를 LSTM에 넣어서 분류하는 방법입니다.

기존의 잘 훈련된 P...

# 3DConvNets # Quo # recognition # Stream # Vadis # Video # 동영상 # 동작 # 모델 # 분류 # Optical # LSTM # Action # Architecture # classification # ConvNet # DeepMind # Flow # I3D # Inflated # kinetics # 비디오