로딩
요청 처리 중입니다...

Q-Q plot: 자료의 정규성 시각화

 Q-Q plot: 자료의 정규성 시각화

qq plot은 자료의 정규성을 확인할 수 있게 해준다. 물론 중심극한정리가 있지만, 가끔씩 정규성이 깨지는 경우가 있다.

이번에는 qq plot에 대해 알아보고 r로 실습해보자. Q-Q plot Q-Q plot은 위의 q-q residuals와 비슷하게 정규성에 대한 것이다.

중간에 있는 선은 qq-line이라고 부른다. 해당 선 위에 있을 경우 해당 식은 정규성에 대한 가정을 만족한다.

Q-Q plot에서 x축은 분위수(quantile)를 의미한다. quartile은 전체 데이터를 무조건 4등분 하는 것, percentile은 전체 데이터를 무조건 100등분 한다. 반면 분위수는 quartile과 percentile을 일반화한 것이다.

그리고 y축에는 표본의 quantile이 위치한다. bad examples 만일 선을 중심으로 위의 예시 처럼 데이터가 좌측에 몰려있을 경우 sigmoid형식으로 그래프가 그려진다. 반면 우측에 몰려있을 경우, 그래프는 3차함수처럼 그려진다.

R ...

# percentile # 정규성 # 자료 # 시각화 # 분위수 # R # quartile # quantile # QQplot # 통계자료분석