데이터 과학 분야에서 왜도(skewness)와 첨도(kurtosis)는 데이터의 분포를 설명하는 두 가지 중요한 개념입니다. 왜도는 데이터 분포의 비대칭성을 나타내는 지표입니다.
데이터 분포가 왼쪽으로 치우쳐져 있으면 왜도 값은 음수가 되고, 오른쪽으로 치우쳐져 있으면 왜도 값은 양수가 됩니다. 데이터 분포가 좌우 대칭인 경우에는 왜도 값은 0에 가까워집니다.
왜도는 분포의 비대칭성을 측정하기 때문에, 데이터의 중심성과 꼬리의 길이를 파악하는 데에 도움이 됩니다. 예를 들어, 주식 시장의 수익률 데이터 분포가 왼쪽으로 치우쳐져 있다면, 이는 주식 시장에서 음수의 수익이 더 자주 발생한다는 것을 의미할 수 있습니다. df.skew() 첨도는 데이터 분포의 뾰족한 정도를 나타내는 지표입니다.
첨도 값이 0보다 크면 데이터 분포는 정규분포보다 더 뾰족한 모양을 갖게 되며, 이를 급첨된 분포라고 합니다. 반대로 첨도 값이 0보다 작으면 데이터 분포는 보다 완만한 모양을 갖게 되며, 이를 평...
#
데이터과학
#
왜도
#
첨도
#
통계
#
통계학