판다스 함수를 활용하여 Z-score를 아주 간단하게 계산할 수 있다. (Z-score, 즉 표준점수에 관련한 이론은 제작년에 티스토리에 포스팅해 놓았음) [데이터전처리] Outlier(이상치/이상값/특이값/특이치 등) 탐지 방법(detection method) : 2.
Z-score 방식 with 이상치 탐지 두번째 시간은 Z-score 방식에 대해서 알아본다. Z-score는 통계에서 중요한 개념이고, 다른 이름으로 Standard-score라고도 한다.
이 방법은 변수에 가우스 분포가 취하고 있다는 가정으로 시작하고.. claryk.tistory.com 티스토리에는 코드블록에 파이썬으로 Z-score 공식대로 진짜 계산하는 것으로 올려놨는데;; 판다스로 다시 간편 버전의 코드를 살펴보자. 오늘의 예제 데이터는 타이타닉!!
중에서도 수치 데이터인 'age' 컬럼이다. 분포도 확인해보자. df = sns.load_dataset('titanic') sns.displot(df["age...
#
python
#
파이썬
#
assign
#
데이터분석
#
데이터분포
#
데이터프레임
#
이상값확인
#
판다스
#
표준점수계산
#
zscore
#
sub
#
std
#
pandas
#
mean
#
div
#
Distribution
#
DataFrame
#
DataAnalysis
#
표준편차