로딩
요청 처리 중입니다...

Leinhardt데이터 회귀모델만들기

 Leinhardt데이터 회귀모델만들기

이번 포스팅에서는 저번시간에 배운 회귀모형추론 방법들을 carData패키지에 있는 Leinhardt데이터로 실습을 해볼 것이다. 일단 다항회귀모형과 가변수회귀모형 포스팅에서 Leinhardt데이터의 모형적합을 다시 해보자 먼저 데이터를 불러와주자 4개의 변수와 105개의 관찰값을 가지고 있는 데이터이다.

이 데이터는 1970년대 105개 나라의 신생아 사망률(infant), 소득(income), 지역(region) 및 원유 수출 여부(oil) 자료가 입력되어 있다. 반응변수는 infant이며, 나머지 변수 income, region, oil이 설명변수가 된다. region과 oil은 Factor로 되어있어 범주형 변수인 것을 알 수 있으며 가변수 회귀모형이 적합이 될 것이다.

GGally패키지에 있는 ggpairs() 함수로 모형 적합 전에 변수들간의 산점도 관계를 살펴보도록 하자 연속형 변수인 income과 infant가 오른쪽으로 긴 꼬리를 가지고 있는 것을 확인해 볼 수 있다....