로딩
요청 처리 중입니다...

머신러닝 분석 절차

 머신러닝 분석 절차

[feature 선언 및 운영 요약 ] 머신러닝을 위해서는 해당 프로세스에 맞는 변수를 별도로 운영할 필요가 있기 때문에 조금은 헷갈리는 경우가 발생한다 (아래 내용은 기본적인 절차를 이해할 수 있도록 도식화 한 것임) 구분 train/val/test File Load [데이터 불러오기 및 데이터 확인] - pd.read_csv('filepath+filename'), train.info()/test.info()] train, test 생성 → train = pd.read_csv('./train.csv') test = pd.read_csv('.

/test.csv') ① train test [탐색적 데이터 분석(EDA)] ②기술 분석 (df.describe() ….. ) 및 시각화 시각화 - 전체 변수 : Pairplot/Heatmap, 연속 변수 : distplot, 범주형 변수 : countplot [데이터 전처리 1] ③불필요 변수 삭제, 결측치/중복값/이상치 처리 예) ID와 같은...

# 0 # 모델 # 분 # 시 # 예시 # 예측 # 예측값 # 월 # 일 # 제출 # 초 # 최적 # 타겟 # 평가 # 데이터 # 년도 # class # DecisionTreeClassifier # depth2의 # GridSearchCV의 # n_components # S4의 # test # Test데이터 # train # unique한 # Xtrain # 객체생성 # 기타 # 학습