저번 포스팅에 이어서 로지스틱 회귀의 실습을 계속 이어가 보자. 데이터 타입 분류 데이터 타입 분류를 통해서 전처리가 좀 더 쉽게 가능하다.
크게 수치형과 범주형 & 오브젝트 타입으로 분류할 수 있다. separate_dtype 함수를 만들어서 데이터 타입을 분류해 보자. def separate_dtype(df): df_catg = df.select_dtypes(include=['object']) df_numr = df.select_dtypes(include=['int64', 'float64']) return [df_catg, df_numr] (df_catg, df_numr) = separate_dtype(df) df_numr.head() 실행 결과 df_catg.head() 실행 결과 해당하는 범주형 & 오브젝트 타입은 다음과 같다. 가장 먼저 Name(이름)부터 살펴보자.
Name(이름) : Mr, Miss, Mrs, Master, Others Sex(성별) : male, fe...
#
Python
#
데이터분석
#
로지스틱회귀
#
타이타닉침몰
#
파이썬
#
희생자데이터