이번 포스팅에서는 kaggle 사이트에 있는 boston house price 자료를 토대로 선형회귀모형을 적합 해볼 것이다. 파일은 밑에 있는것을 사용하면 된다.
첨부파일 boston.csv 파일 다운로드 먼저 tidyverse패키지를 불러온 후 read_csv 함수로 파일을 불러왔다. 변수소개 str함수로 데이터의 특징을 살펴볼 수 있다.
변수의 개수는 총 14개이며 13개의 설명변수와 1개의 종속변수가 있다. Input features in order 1) CRIM: per capita crime rate by town 도시별 1 인당 범죄율 2) ZN: proportion of residential land zoned for lots over 25,000 sq.ft.25000 평방피트를 초과 거주지역 비율(평방피트는 미국의 면적 단위이다.) 3) INDUS: proportion of non-retail business acres per town 비소매상업지역 면적 비율 4) ...
원문 링크 : 보스턴지역의 집값의 미치는 요인은 무엇일까?