0. Introduction 최근 Video Classification을 공부하는 도중 Two Stream 방식의 대표적인 Model을 사용해 보고자 마음 먹게되었습니다.
이번에 Review해 볼 Paper는 I3D 방식(Inflated 3D)을 제시한 것을 알아보도록 하겠습니다. 제목은 ‘Quo Vadis, Action Recognition?
A New Model and the Kinetics Dataset’이며 Link에서 확인 가능합니다. 실제 구현은 https://github.com/deepmind/kinetics-i3d에서 구할 수 있습니다. 1.
The old ones 먼저 I3D가 나오기 전에 사용하던 방식들에 대해서 알아보기로 하겠습니다. 1.1. The old 1 : ConvNet + LSTM 기존 CNN에서 사용하던 2D ConvNet을 이용하여 Video의 각 Frame마다 Feature를 뽑아내고 이를 LSTM에 넣어서 분류하는 방법입니다.
기존의 잘 훈련된 P...
#
3DConvNets
#
Quo
#
recognition
#
Stream
#
Vadis
#
Video
#
동영상
#
동작
#
모델
#
분류
#
Optical
#
LSTM
#
Action
#
Architecture
#
classification
#
ConvNet
#
DeepMind
#
Flow
#
I3D
#
Inflated
#
kinetics
#
비디오