다중회귀분석을 실시한 이후에는 부분검정을 실시할 수 있고, 추가로 다중공선성에 대한 점검을 실시해야 한다. 다중공선성이란 무엇인지, 이것이 왜 문제가 되는지, 그리고 어떻게 점검하는지에 대해서 알아보자.
다중공선성이란 다중공선성은 독립변수들 간에 관계가 클 때 발생한다. 데이터 선별이 잘못되었을 때 이런 일이 발생한다.
쉬운 예시로 다음 식을 보자. 아버지의 키와 어머니의 키가 각각 아들의 키에 어떤 영향을 주고 싶은지 알 고 싶어서 위와 같은 식을 만들었다고 하자.
하지만 실수로 어머니의 키의 자리에 아버지의 키를 넣었다. 이 경우에 문제가 되는 것이 독립변수들 간에 의존관계, 상관관계가 생기는 것이다.
그럼 R에서 실제로 이것을 만들어보자. 지금위에서 보면 "Coefficients: (1 not defined because of singularities)"라는 결과를 출력했다.
그리고 x2부분에는 아예 NA를 넣었다. 이는 x1과 x2가 완벽한 선형관계에 있기 때문이다.
이는 곧...
#
car
#
독립변수
#
등분산성
#
문과통계
#
비대칭도
#
상관계수
#
선형관계
#
연결함수
#
종속변수
#
첨도
#
통계
#
통계자료분석
#
통계학
#
다중공선성
#
계수
#
ceresPlots
#
crPlots
#
gvlma
#
leverage
#
location
#
performanceanalytics
#
QQ
#
R
#
Rsquare
#
scale
#
signif
#
VIF
#
회귀분석
원문 링크 : 회귀분석 모형의 점검: 다중공선성