데이터 전처리 2 본격적인 데이터 분석을 시작하기 전에 신뢰할 수 있는 데이터를 위한 데이터 정제 과정이 필요합니다. 이번 과정에서는 데이터 필터링과 이상치 제거를 통해 데이터를 정리해보겠습니다!️️
분석 대상 선정 모든 데이터를 분석하면 좋겠지만 건강 관리의 패턴이 크게 다른 연령대를 함께 분석하면 결과가 왜곡될 수 있습니다. 그래서 분석대상을 이렇게 정했습니다! ️
청소년, 성인 그룹 ️ 비슷한 생활 패턴과 건강 목표를 가진 그룹을 중심으로 분석 filtered_data = data[data['age'].isin([2, 3])] # 2: 청소년, 3: 성인 2. 데이터 필터링 및 이상치 제거 데이터에는 여러가지 원인으로 인해 잘못된 값이 포함될 수 있어요.
이런 값이 데이터에 포함되면 분석 결과가 엉망이 될 수 있어요. 그래서 이번 과정을 통해 이러한 잘못된 값들인 이상치를 찾아내고 제거해보겠습니다!
1) descirbe()을 활용한 이상치 확인 우선 describe()를 활용...
원문 링크 : 데이터 필터링, 이상치 제거를 통한 전처리