로딩
요청 처리 중입니다...

선형회귀모형 lm()함수 기본 사용법[RStudio]

 선형회귀모형 lm()함수 기본 사용법[RStudio]

회귀분석의 가장 기본 단순선형회귀모형에 대하여 설명하겠다. 첨부파일 train.csv 파일 다운로드 데이터는 캐글사이트에서 다운로드 받았으며 파일은 밑에 첨부를 해두겠다.

먼저 데이터를 불러와보자 데이터를 불러오기 위하여 'tidyverse' 패키지를 실행시켜주자 train데이터를 read_csv를 이용하여 불러왔다. 데이터를 불러오는 방법은 필자 블로그의 다른 글을 참고하면 된다.

먼저 회귀모형을 적합시키기 전에 회귀모형이 어떻게 생겼는지 알아보자 기본적인 회귀모형은 반응변수와 설명변수로 이루어져있다. 반응변수(종속변수) : 우리가 파악하고 예측하고자 하는 특정 현상을 나타내는 변수(Y) 설명변수(독립변수) : 반응변수가 나타내는 특정 현상에 연관되어 있을 것으로 판단되는 변수( ) 이 두가지로 이루어져있는 것이 기본적인 회귀모형의 구성이다.

회귀분석은 반응변수와 설명변수 사이의 확률적 관계를 하나의 함수형태로 나타내려는 것인데 i=1,....,n 이런 식으로 수식이 만들어진다. ...