이번 포스팅에서는 저번시간에 배운 회귀모형추론 방법들을 carData패키지에 있는 Leinhardt데이터로 실습을 해볼 것이다. 일단 다항회귀모형과 가변수회귀모형 포스팅에서 Leinhardt데이터의 모형적합을 다시 해보자 먼저 데이터를 불러와주자 4개의 변수와 105개의 관찰값을 가지고 있는 데이터이다.
이 데이터는 1970년대 105개 나라의 신생아 사망률(infant), 소득(income), 지역(region) 및 원유 수출 여부(oil) 자료가 입력되어 있다. 반응변수는 infant이며, 나머지 변수 income, region, oil이 설명변수가 된다. region과 oil은 Factor로 되어있어 범주형 변수인 것을 알 수 있으며 가변수 회귀모형이 적합이 될 것이다.
GGally패키지에 있는 ggpairs() 함수로 모형 적합 전에 변수들간의 산점도 관계를 살펴보도록 하자 연속형 변수인 income과 infant가 오른쪽으로 긴 꼬리를 가지고 있는 것을 확인해 볼 수 있다....
원문 링크 : Leinhardt데이터 회귀모델만들기