로딩
요청 처리 중입니다...

[파이썬 데이터 분석] 선형 회귀분석의 주요 이슈와 모형 선택(이론)

 [파이썬 데이터 분석] 선형 회귀분석의 주요 이슈와 모형 선택(이론)

선형 회귀분석을 실시하는 과정에서 기본 가정을 위배하는 다양한 이슈에 부딪힐 수 있다. 이번에는 범주형 설명 변수가 존재하는 경우, 데이터에 이상치가 존재하는 경우, 독립 변수 간에 선형 상관관계가 존재하는 경우에 이를 극복하기 위한 방법에 대해 알아보자.

질적 설명 변수 질적 설명 변수(qualitative variable)를 포함한 모형은 가변수(dummy variable) 또는 지시 변수(indicator variable) 형태로 변수를 변환하여 모형에 포함하는 절차가 필요하다. 예를 들면 성별이라는 범주형 변수를 모형에 포함하고 싶을 때 0 또는 1을 가지는 남성 여부 또는 여성 여부라는 변수를 생성해야 한다.

이때 추가생성 변수의 수 = 명목형 변수의 그룹 수 -1이다. 남성일 때의 회귀식과 여성일 때의 회귀식을 각각 따로 적합하는 것과 같다.

새롭게 생성되는 변수 Race (인증) Asian Caucasian African American (Reference) 0 0 Ca...

# LASSO # 차원축소 # 질적설명변수 # 전진선택 # 이상치 # 선형회귀분석 # 부분집합 # 라쏘 # 데이터분석 # 단계적선택 # 다중공선성 # 능형회귀 # 후진제거