파이썬의 판다스, 넘파이, matplotlib 모듈 기반으로 상대도수와 누적상대도수에 대해 알아보는 시간을 가져보자. scores_em이라는 데이터 기반으로 알아볼 예정이며, 예시 데이터는 요기 아래에서 다운로드 가능하다 첨부파일 scores_em.csv 파일 다운로드 우선, 상대도수에 대해 알기 전에 도수분포표와 히스토그램이 무엇인가?에 대해 알아야 한다.
도수분포표(frequency table)와 히스토그램(histogram) 도수분포표란, 중고등학교를 나왔다면 매우 익숙한 주제일 것이다. 간단하게 요약만 하자면 자료의 갯수를 세고, 자료 내 최대·최솟값을 찾은 후, 데이터를 몇 개의 구간으로 나눌지 결정 후, 각 구간에 데이터가 몇개 있는지 카운팅하는 것을 표로 나타낸 것을 의미한다.
도수분포표 예시/ 출처: 필로홍의 데이터 노트 히스토그램은, 위 도수분포표를 시각환 한 것을 의미한다. 도수분포표와 히스토그램 / 출처: NGeneration님 블로그 상대도수와 누적 상대도수란 ...
#
BDA
#
브다
#
빅데이터
#
빅데이터분석
#
빅데이터분석학회
#
빈도
#
상대도수
#
통계
#
통계공부
#
파이썬
#
판다스
#
도수분포표
#
도수
#
데이터분석
#
BDAA
#
matplotlib
#
numpy
#
python
#
기술통계
#
기초통계
#
넘파이
#
누적상대도수
#
데이터
#
데이터공부
#
히스토그램