로딩
요청 처리 중입니다...

회귀분석 변수선택

 회귀분석 변수선택

이번 포스팅에서는 회귀모델을 만드는데 가장 중요하다고 생각되는 변수선택과정에 대해서 배워보도록 할것이다. 우리가 데이터를 이용하여 회귀분석을 할 때 데이터에 많은 변수들을 다 넣어 회귀모델을 만드는 것은 분석에 있어서 비효율적이고 overfitting 가능성이 생길 수도 있다.

일부 변수를 이용하며 모형의 설명력을 높히는 것이 효율적인 분석이며 예측력이 향상되고 모형의 해석이 용이해질 것이다. 그러므로 적절한 변수들을 조합하여 회귀모형을 만드는 것이 가장 중요할 것이다.

반응변수의 변동을 설명할 수 있는 많은 설명변수들 중에서 '최적'의 설명변수를 선택하는 절차를 변수선택이라고 한다. 방법은 3가지가 있다. 1) 검정에 의한 방법 2) 모형평가 측도에 의한 방법 3) Shrinkage 방법 이것들에 대해서 알아보는 시간을 가져보도록 하겠다.

검정에 의한 변수선택방법 SAS나 SPSS등에서 일반적으로 이루어지는 방법이다. 후진소거법, 전진선택법, 단계별 선택법이있다.

변수 선택 과정에...