로딩
요청 처리 중입니다...

[파이썬 머신러닝 완벽가이드] 2장. (4) 사이킷런으로 수행하는 타이타닉 생존자 예측

 [파이썬 머신러닝 완벽가이드] 2장. (4) 사이킷런으로 수행하는 타이타닉 생존자 예측

06. 사이킷런으로 수행하는 타이타닉 생존자 예측 (1) 데이터 전처리 [데이터 확인] import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline titanic_df = pd.read_csv('titanic_train.csv') titanic_df.head(3) 타이타닉 데이터를 가져온 후 상위 3개의 그룹의 데이터를 확인합니다.

[데이터 정보 확인] print('\n ### 학습 데이터 정보 ### \n') print(titanic_df.info()) 데이터 정보를 확인하면, 결측값이 얼마나 있는 지 확인할 수 있습니다. RangeIndex가 891개이므로 결측값이 없다면 Non-Null Count가 891이어야 합니다.

여기선 891이 아닌 Age, Cabin, Embarked 컬럼에는 결측값이 존재한다는 것을 알 수 있습니다. [결측값 확...

# sklearn # 파이썬 # 타이타닉생존자예측 # 타이타닉 # 알고리즘 # 사이킷런 # 머신러닝알고리즘 # 머신러닝 # 딥러닝 # 데이터사이언티스트 # 데이터분석 # 판다스