이전 그들에서 논문통계에서 자주 활용되는 카이제곱검정을 활용 두 변수의 연관성에 대하여 살펴보았다. 가설검정을 통해 두 변수의 독립여부를 판단할 수 있었다.
그런데 상황에 따라서는 각 셀의 기대값과 실제값의 비교를 해볼 수 있고 이로 인하여 변수 간의 관계를 더욱 명확히 살펴볼 수도 있다. 특히 이는 변수들이 취하는 값이 많을 때 더욱 명확하게 파악할 수 있게 해준다.
즉, 카이제곱검정을 실시할 때 어떠한 셀의 영향력이 강한지 혹은 약한지 판단할 때 이용할 수 있는 것이다. 이를 위해서 잔차를 이용한 분석을 할 수 있다.
카이제곱검정과 관련한 잔차분석에는 몇 가지가 있는데 본 예제에서는 표준화잔차(Standardized residual) 혹은 피어슨 잔차(Pearson residual)이라고 불리우는 잔차 분해 봅에 대하여 살펴보도록 한다. 본 분석에는 Stata를 활용하며 예제 자료의 경우 Wooldridge의 교과서에서 사용된 자료를 활용하도록 한다.
분석에 활용한 변수는 eng...
#
Stata
#
tabchi
#
기대값
#
카이제곱
#
카이제곱검정
#
표준화잔차
#
피어슨잔차
원문 링크 : 카이제곱검정 표준화잔차 Stata