머신러닝 분석 절차

[feature 선언 및 운영 요약 ] 머신러닝을 위해서는 해당 프로세스에 맞는 변수를 별도로 운영할 필요가 있기 때문에 조금은 헷갈리는 경우가 발생한다 (아래 내용은 기본적인 절차를 이해할 수 있도록 도식화 한 것임) 구분 train/val/test File Load [데이터 불러오기 및 데이터 확인] - pd.read_csv('filepath+filename'), train.info()/test.info()] train, test 생성 → train = pd.read_csv('./train.csv') test = pd.read_csv('.

/test.csv') ① train test [탐색적 데이터 분석(EDA)] ②기술 분석 (df.describe() ….. ) 및 시각화 시각화 - 전체 변수 : Pairplot/Heatmap, 연속 변수 : distplot, 범주형 변수 : countplot [데이터 전처리 1] ③불필요 변수 삭제, 결측치/중복값/이상치 처리 예) ID와 같은...

요청 처리 중입니다...

머신러닝 분석 절차

등록된 다른 글