로딩
요청 처리 중입니다...

[Python 주피터 프로그래밍] 스캐터플랏, 추세선, 히스토그램, 히트맵 등 다양한 차트 그리기 | Pandas를 사용한 데이터 EDA 분석

 [Python 주피터 프로그래밍] 스캐터플랏, 추세선, 히스토그램, 히트맵 등 다양한 차트 그리기 | Pandas를 사용한 데이터 EDA 분석

EDA를 하기 위한 다양한 시각화 도구를 설명드리려고 합니다. EDA(Exploratory Data Analysis)란 탐색적 데이터 분석이라고도 하며, 데이터 세트를 탐색하고 이해하기 위해 다양한 분석 기법과 시각화 도구를 사용하는 프로세스를 의미합니다.

EDA는 데이터 이해, 데이터 정제, 변수 탐색, 변수 간 상관관계 분석, 데이터 시각화, 결론 도출의 단계로 이루어집니다. 기본적으로 데이터를 이해하기 위해서 기본 정보를 우선적으로 파악합니다.

이는 앞서 다뤘던 head(), tail(), info(), descibe()의 pandas 내장 함수로 파악할 수 있습니다. 데이터를 정제하기 위해서 결측치, 차원 축소 등을 진행합니다.

이는 isnull(), fillna(), dropna()등을 사용하여 진행합니다. 변수를 탐색한 결과를 시각화하고, 상관관계를 시각화 하기 위해 스캐터플랏, 플랏메소드, 히스토그램, 히트맵 등의 차트와 그래프를 활용할 예정입니다.

스캐터플랏 기본적인 ...

# EDA데이터분석 # 스캐터플랏 # 주피터 # 주피터노트북 # 추세선 # 클러스터히트맵 # 파이썬 # 판다스 # 플랏메소드 # 회귀선 # 히스토그램 # 상관관계 # 박스플랏 # 데이터합치기 # jupyter # Pandas # python # 댄도그램히트맵 # 데이터EDA # 데이터머지 # 데이터불러오기 # 데이터저장하기 # 데이터전처리 # 데이터컨캣 # 히트맵