Chapter 4.1 기계학습 워크플로에서의 데이터 준비 데이터 준비에는 기계학습 구현 워크플로 전체 노력의 평균 43%가 들어가며, 기계학습 워크플로에서 가장 자원 집약적인 활동이라 할 수 있다. cf) 모델 선택과 구현에는 전체의 17%만 들어간다. 데이터 파이프라인 데이터 준비 단계는 데이터 파이프라인에 속한다.
원본 데이터를 입력받아 기계학습 모델을 훈련하거나 훈련된 기계학습 모델이 데이터를 예측에 사용 가능한 형식으로 출력한다. 데이터 준비 활동 데이터 수집(Data Acquisition) 식별(Identification) 훈련과 예측에 사용할 데이터 유형을 식별한다. ex) 자율 주행 자동차의 경우 레이더, 비디오, 탐지, 범위 지정 등의 데이터의 필요성 식별을 포함할 수 있다.
수집(Gathering) 데이터의 출력을 식별하고 데이터 수집 방법을 결정한다. 수집된 데이터는 다양한 형식일 수 있다.
라벨링(Labeling) 데이터 전처리(Data Pre-processing...
#
AI
#
라벨링
#
머신러닝
#
변환
#
샘플링
#
수집
#
식별
#
워크플로
#
인공지능
#
정제
#
특성선택
#
특성엔지니어링
#
데이터준비과정
#
데이터전처리
#
ISTQB
#
machinelearning
#
ML
#
QA
#
TE
#
Test
#
Tester
#
TL
#
기계학습
#
기계학습워크플로
#
데이터
#
특성추출