데이터 전처리 IQR 이상치(Outlier) 제거 방법 (상세 과정 설명)에 대한 포스팅입니다. 1. IQR 이란?
IQR(Interquartile Range)는 데이터 집합을 4등분 하여 Q1 ~ Q4로 나눈 뒤 양 끝 1/4을 제외한 중간 50%를 나타내는 중심적인 통계적 측정값입니다. Q1 제1사분위 수 : ~25% Q2 제2사분위 수 : ~50% Q3 제3사분위 수 : ~75% Q4 제4사분위 수 : ~100% IQR을 계산하려면 먼저 데이터 집합을 정렬한 다음, 전체 데이터의 25번째 백분위수(Q1, 제1사분위 수)와 75번째 백분위수(Q3, 제3사분위 수)를 찾아 아래와 같이 계산합니다.
IQR=Q3−Q1 출처 : ashington.medium.com IQR은 데이터의 중심적 경향을 나타내는 중간값과 함께 사용되어 데이터의 퍼짐 정도를 파악할 때 유용합니다. 특히 이상치를 감지하거나 제거하는 데 활용될 수 있습니다. 2.
Outlier (이상치) "Outlier"는 통계학...
#
IQR
#
파이썬이상치제거
#
파이썬이상치
#
파이썬IQR
#
인덱스재설정
#
이상치제거인덱스
#
이상치제거방법
#
이상치제거
#
이상치
#
데이터전처리
#
데이터분석
#
outlier제거방법
#
outlier
#
파이썬인덱스재설정