EDA EDA(탐색적 데이터 분석)을 통해 데이터 셋의 전반적인 분포와 특성을 파악하려고 합니다. 이 과정을 통해 데이터가 어떤 정보를 내포하고 있으며, 어떤 부분에서 추가적인 탐색이 필요한지를 확인해보겠습니다 데이터 파악 전처리가 완료된 데이터를 대상으로 describe() 함수를 이용해 기초 통계 정보를 확인하였습니다.
이를 통해 각 변수의 주요 통계량을 파악하겠습니다. 2. 변수 분포 시각화 변수를 개별적으로 혹은 함께 살펴봄으로써 어떤 변수들이 중요한 영향력을 갖고 있을지 가늠해볼 수 있습니다.
또한 향후 상관관계 분석 및 모델링 시 핵심 변수를 우선적으로 고려할 수 있는 기반이 됩니다. # 수치형 변수 numeric_cols = filtered_data.select_dtypes(include=['float64', 'int64']).columns # 그래프 행, 열 개수 지정 nrows = 4 ncols = 4 plt.figure(figsize=(16, 12)) for i, ...
원문 링크 : 파이썬으로 탐색적 데이터 분석(EDA) 방법