판다스 라이브러리에도 몇 개의 시각화 함수가 있지만 별로 사용하진 않는다. 왜냐면 matplotlib, seaborn, plotly 등등 좋은 시각화 라이브러리가 많기 때문이다.
그러나 판다스에 제공하는 시각화 함수 중 평행 좌표 그래프는 꽤 유용하다. 평행 좌표 그래프(parallel_coordinates)는 일반적으로 특정 변수와 나머지 변수와의 값을 동시에 시각화하고 분석하는 데 사용한다.
유형이나 크기가 완전히 다른 변수들을 동시에 비교할 수 있는 것이다.(<-정규화 작업 필요) x축에 변수들이 나열되고 각 변수의 값을 나타내는 수치가 y축에 표현되는데 이들이 쭈욱 연결되는 평행선으로 표현된다.
EDA 과정에서 활용하기 좋고, 머신러닝 등 모델링에 활용할 주요 변수를 선정할 때에도 참고할 수 있을 것이다. 긴 설명보다 예제를 통해서 알아보자 ㅠㅠ 오늘 준비할 라이브러리는 이렇게 많다!
import numpy as np import pandas as pd import matpl...
#
DataAnalysis
#
데이터시각화
#
데이터정규화
#
사이킷런
#
와인퀄리티데이터
#
최소최대정규화
#
파이썬
#
판다스
#
평행좌표그래프
#
데이터분석
#
winequality
#
DataVisualization
#
matplotlib
#
Normalization
#
pandas
#
parallel_coordinates
#
python
#
sckitlearn
#
평행좌표시각화
#
MinMaxScaler
#
데이터스케일링