# 주어진 데이터 셋에서 f2가 0값인 데이터를 age를 기준으로 오름차순 정렬하고 # 앞에서 부터 20개의 데이터를 추출한 후 # f1 결측치(최소값)를 채우기 전과 후의 분산 차이를 계산하시오 (소수점 둘째 자리까지) # - 데이터셋 : basic1.csv # - 오른쪽 상단 copy&edit 클릭 -> 예상문제 풀이 시작 # - File -> Editor Type -> Script library(dplyr) df<-read.csv('basic1.csv') df%>%filter(f2==0)%>%arrange(age)%>%slice(1:20)%>%mutate(pre_f1=ifelse(is.na(f1),min(f1,na.rm=T),f1))%>%summarise(val1=var(pre_f1),val2=var(f1,na.rm=T))%>%data.frame%>%apply(1,diff)%>%round(2) Engineer-Big-Data-Analysis_R/[R]_T1_16_분산.ipynb...
원문 링크 : [빅분기 실기 R] T1-16. 분산