로딩
요청 처리 중입니다...

[데이터시각화] 판다스(pandas)의 평행 좌표 그래프(parallel_coordinates)로 여러 변수 값 비교하기

 [데이터시각화] 판다스(pandas)의 평행 좌표 그래프(parallel_coordinates)로 여러 변수 값 비교하기

판다스 라이브러리에도 몇 개의 시각화 함수가 있지만 별로 사용하진 않는다. 왜냐면 matplotlib, seaborn, plotly 등등 좋은 시각화 라이브러리가 많기 때문이다.

그러나 판다스에 제공하는 시각화 함수 중 평행 좌표 그래프는 꽤 유용하다. 평행 좌표 그래프(parallel_coordinates)는 일반적으로 특정 변수와 나머지 변수와의 값을 동시에 시각화하고 분석하는 데 사용한다.

유형이나 크기가 완전히 다른 변수들을 동시에 비교할 수 있는 것이다.(<-정규화 작업 필요) x축에 변수들이 나열되고 각 변수의 값을 나타내는 수치가 y축에 표현되는데 이들이 쭈욱 연결되는 평행선으로 표현된다.

EDA 과정에서 활용하기 좋고, 머신러닝 등 모델링에 활용할 주요 변수를 선정할 때에도 참고할 수 있을 것이다. 긴 설명보다 예제를 통해서 알아보자 ㅠㅠ 오늘 준비할 라이브러리는 이렇게 많다!

import numpy as np import pandas as pd import matpl...

# DataAnalysis # 데이터시각화 # 데이터정규화 # 사이킷런 # 와인퀄리티데이터 # 최소최대정규화 # 파이썬 # 판다스 # 평행좌표그래프 # 데이터분석 # winequality # DataVisualization # matplotlib # Normalization # pandas # parallel_coordinates # python # sckitlearn # 평행좌표시각화 # MinMaxScaler # 데이터스케일링