로딩
요청 처리 중입니다...

T1-23. 중복 데이터 제거 Drop Duplicates

 T1-23. 중복 데이터 제거 Drop Duplicates

문제 f1의 결측치를 채운 후 age 컬럼의 중복 제거 전과 후의 'f1' 중앙값 차이를 구하시오 - 결측치는 f1의 데이터 중 내림차순 정렬 후 10번째 값으로 채움 - 중복 데이터 발생시 뒤에 나오는 데이터를 삭제함 - 최종 결과값은 절대값으로 출력 데이터셋 : basic1.csv 풀이 import pandas as pd df = pd.read_csv('../input/bigdatacertificationkr/basic1.csv') df = df.sort_values(by="f1") df["f1"] = df["f1"].fillna(df["f1"].iloc[9]) df1 = df.drop_duplicates(["age"]) abs(df["f1"].median()-df1["f1"].median()) 코드사용 sort_values : 내림차순 fillna : 결측치 대처 drop_duplicates : 중복제거...