[feature 선언 및 운영 요약 ] 머신러닝을 위해서는 해당 프로세스에 맞는 변수를 별도로 운영할 필요가 있기 때문에 조금은 헷갈리는 경우가 발생한다 (아래 내용은 기본적인 절차를 이해할 수 있도록 도식화 한 것임) 구분 train/val/test File Load [데이터 불러오기 및 데이터 확인] - pd.read_csv('filepath+filename'), train.info()/test.info()] train, test 생성 → train = pd.read_csv('./train.csv') test = pd.read_csv('.
/test.csv') ① train test [탐색적 데이터 분석(EDA)] ②기술 분석 (df.describe() ….. ) 및 시각화 시각화 - 전체 변수 : Pairplot/Heatmap, 연속 변수 : distplot, 범주형 변수 : countplot [데이터 전처리 1] ③불필요 변수 삭제, 결측치/중복값/이상치 처리 예) ID와 같은...
#
0
#
모델
#
분
#
시
#
예시
#
예측
#
예측값
#
월
#
일
#
제출
#
초
#
최적
#
타겟
#
평가
#
데이터
#
년도
#
class
#
DecisionTreeClassifier
#
depth2의
#
GridSearchCV의
#
n_components
#
S4의
#
test
#
Test데이터
#
train
#
unique한
#
Xtrain
#
객체생성
#
기타
#
학습
원문 링크 : 머신러닝 분석 절차