패널 데이터: 왜 사용하며 어떻게 사용하는가?

패널 데이터는 같은 값에 대해서 두번 이상 측정된 것을 의미한다. 당연히 기존의 OLS방식과는 다른 방식으로 데이터를 분석하게 된다.

왜 패널 데이터를 사용하는가? library(palmerpenguins) library(ggplot2) pengs<-penguins names(pengs) <- c("sp" ,"is", "bl", "bd", "fl" ,"bm" ,"sx", "yr") 먼저 데이터를 불러와보자.

그리고 나서 x축에 bd, y축에 bl을 넣으면 위와 같은 산점도를 볼 수 있다. 굳이 회귀 선을 그어보면 위와 같이 음의 기울기가 나온다.

하지만 종을 기준으로 선을 따로 그으면 위와 같이 양의 기울기가 나온다. 즉, 데이터의 집단에 따라서 데이터 분석 결과가 아예 달라질 수 있고, 이로 인해서 패널 데이터 분석을 하는 것이다.

패널 데이터도 일종의 데이터 집단인 "시간"을 중심으로 데이터를 재분석 하는 것이며, 시간에 어떠한 소속이냐에 따라서 데이터를 분석하게 될 것이다. 기...

요청 처리 중입니다...

패널 데이터: 왜 사용하며 어떻게 사용하는가?

등록된 다른 글