이전 포스팅의 로지스틱 회귀와 오즈(odds) 이론에 이어서 이번엔 실습을 진행해 보자. 데이터셋은 Kaggle, Titanic(재난 머신러닝 중 타이타닉 침몰 희생자 관련 데이터)를 가지고 해 보자.
우선 해당 데이터셋은 seaborn 패키지나 URL 혹은 구글 검색을 통해서 다운로드 받을 수 있다. 주요 독립 변수(x)와 종속 변수(y)는 다음과 같다.
독립 변수(x) Pclass(좌석 등급) : 1 = 1등석 / 2 = 2등석 / 3 = 3등석 - 사회적 계층을 대표(1등석 = Upper / 2등석 = Middle / 3등석 = Lower) Sex(성별) Age(나이) Sibsp(형제 자매 / 배우자 수) Parch(부모와 자식 수) - 탑승한 부모, 자식 수(일부 아이들은 유모와 함께 탑승했기 때문에 그들의 값은 0) Ticket(티켓 번호) Fare(요금) Cabin(객실 번호) Embarked(정박 항구) : C = Cherbourg / Q = Queenstown / S ...
#
missingno
#
탐색적데이터분석
#
타이타닉
#
침몰데이터
#
종속변수
#
로지스틱회귀
#
독립변수
#
데이터전처리
#
데이터분석
#
Python
#
파이썬