여기서 다루는 내용의 키워드 - 데이터셋 분할 - 학습 데이터셋(Train data) - 검증 데이터셋(Validation data) - 테스트 데이터셋(Test data) - Train / Validation / Test 학습을 할 때 데이터가 필요합니다 그런데 이 데이터를 모두 학습에'만' 사용할까요? 데이터를 모두 학습에만 사용한다면 학습이 잘 되었는지 확인은 어떻게 할까요 그래서 데이터를 모두 학습에 쓰는게 아니라 역할에 따라 분할을 합니다 데이터셋을 일단 크게 2개로 나눕니다 학습에 사용할 학습 데이터셋과 테스트에 사용할 테스트 데이터셋입니다 1차 쪼개기 테스트 데이터셋은 마지막에 평가할 때 딱 한번만 사용됩니다 그런데 학습한 모델이 정말 학습이 잘된건가 확인하고 싶잖아요?
또는 학습 데이터에 너무 overfitting이 된 것은 아닌가 이런 걱정이 들 수도 있습니다 그래서 학습 데이터셋 중에서 일부를 분리해서 검증데이터(validation data)로 사용합니다 2차 쪼개...
#
test
#
train
#
validation
#
검증데이터셋
#
데이터셋
#
딥러닝
#
딥러닝학습
#
테스트데이터셋
#
학습데이터셋