문제 # 주어진 데이터 셋에서 f2가 0값인 데이터를 age를 기준으로 오름차순 정렬하고 # 앞에서 부터 20개의 데이터를 추출한 후 # f1 결측치(최소값)를 채우기 전과 후의 분산 차이를 계산하시오 (소수점 둘째 자리까지) # - 데이터셋 : basic1.csv # - 오른쪽 상단 copy&edit 클릭 -> 예상문제 풀이 시작 # - File -> Editor Type -> Script 풀이 import pandas as pd df = pd.read_csv("../input/bigdatacertificationkr/basic1.csv") dfage = df[df["f2"]==0].sort_values("age").head(20) dfmin = dfage.fillna(dfage["f1"].min()) round(dfage["f1"].var()-dfmin["f1"].var(),2) 코드사용 sort_values : 정렬 fillna : 결측치 대체 var : 분산...
원문 링크 : [py] T1-16. 분산 Expected Question