다중공선성은 회귀분석에서 발생하는 문제 독립변수 간에 강한 상관관계가 있을 때 발생 이들 변수 중 어느 하나를 통해 다른 변수를 예측할 수 있기 때문 다음과 같은 상황에서 발생 첫째, 독립변수들이 서로 강한 선형 상관관계를 가지고 있는 경우입니다. 예를 들어, 어떤 회귀모델에서 '집 크기'와 '방의 개수'라는 두 개의 독립변수가 있을 때, 이들 변수는 양의 상관관계를 가질 수 있습니다.
즉, 집이 크면 방의 개수도 많을 가능성이 높습니다. 이 경우 독립변수들 간의 상관관계가 높아져 다중공선성 문제가 발생할 수 있습니다.
둘째, 독립변수들이 동일한 정보를 제공하는 경우에도 다중공선성이 발생할 수 있습니다. 예를 들어, '판매량'을 예측하는 회귀모델에서 '매출액'과 '판매금액'이라는 두 개의 독립변수가 있다고 가정해 봅시다.
이 두 변수는 사실상 동일한 정보를 제공하기 때문에, 이들 간에 강한 상관관계가 발생하고 다중공선성 문제가 발생할 수 있습니다. 문제 첫째로, 회귀계수의 추정이 불...
원문 링크 : 다중공선성 문제