산포도(분산도) : 자료의 퍼짐 정도 ① 분산(Variance), 표준편차(Standard Deviation) - 분산은 평균을 중심으로 밀집되거나 퍼짐 정도(각 자료와 평균과의 편차의 제곱을 이용). 표준편차는 분산의 제곱근. => 모표준편차와 표본표준편차는 각 분산에 제곱근을 씌운 값 - 분산은 특이점에 매우 큰 영향을 받으며 분산이 클수록 각 자료값이 평균으로부터 넓게 흩어진 형태를 갖는다. ② 범위(Range) : 데이터 간 최댓값과 최솟값의 차이 ③ 평균 절대 편차(평균편차, 절대편차, MAD) : 각 자료값과 표본평균과의 편차의 절댓값에 대한 산술평균 - 이상치에 대한 영향을 적게 받음.
절대 편차의 최소값을 갖는 자료값은 평균이 아닌 중앙값이다. 표준 편차가 클수록 자료는 폭넓게 분포한다. ④ 사분위범위(IQR) : 자료를 크기 순으로 배열 후 자료의 1/4에 해당하는 1사분위수(Q1), 3/4에 해당하는 3사분위수(3Q)를 구한다.
사분위범위는 Q3-Q1으로 정의되며...
#
범위
#
평균절대편차
#
첨도
#
자격증공부
#
자격증
#
왜도
#
산포도
#
사분위범위
#
빅분기필기
#
빅분기
#
빅데이터자격증
#
빅데이터분석기사필기
#
빅데이터분석기사
#
빅데이터
#
분산
#
변동계수
#
표준편차
원문 링크 : 빅데이터분석기사 필기 공부 day-9