로딩
티스토리 데이터 처리 중입니다.

캐글 실전 titanic 생존자 예측

 캐글 실전 titanic 생존자 예측

서론 안녕하세요, 이번 글에서는 Google Colab 환경에서 Python을 활용하여 머신러닝 알고리즘을 이용해 타이타닉호의 생존자를 예측하는 과정을 상세하게 설명하려 합니다. 이 과정은 대표적인 머신러닝 프로젝트의 흐름을 그대로 따르며, 데이터 분석부터 모델의 성능 평가까지 일련의 과정을 거치게 됩니다.

우선, 탐색적 데이터 분석(EDA)를 통해 데이터를 깊이 있게 이해하고, 이를 바탕으로 전처리 과정에서 결측치와 이상치를 수정합니다. 이후, 데이터 인코딩으로 데이터를 머신러닝 알고리즘이 이해할 수 있는 형태로 변환하며, 데이터 스케일링을 통해 모든 데이터를 동일한 범위로 정규화합니다.

데이터의 준비가 완료되면, 데이터를 학습용과 테스트용으로 분리하고, 적절한 머신러닝 모델을 선택하여 학습을 진행합니.....