이번엔 데이터 과학의 기초인 모집단과 표본, 척도와 변수, 설명변수와 반응 변수에 대해 살펴보자. 모집단과 표본 데이터를 분석하고 정렬하기 위해서는 그에 맞는 표본이 있어야 한다.
데이터 과학은 데이터를 이용해 어떤 수치를 구하는 것에만 국한되지 않는다. 데이터로부터 얻은 수치들을 이용해 의사결정의 도구로 삼을 수 있다.
지금도 사회과학이나 임상 실험과 관련된 데이터는 데이터 수집에 따른 비용 문제로 데이터 수집이 제한되고 있다. 전통적인 통계학은 이런 문제를 표본 추출 방법을 통해 극복했다.
관심의 대상이 되는 전체 집단 즉, 모집단(population)의 특성을 해당 모집단으로부터 추출된 표본(sample)을 이용하여 추정(inference)한다. 모집단에서 표본이 추출되는 과정은 확률을 기반으로 수행되며, 표본의 특성 추정치인 통계량을 이용해서 모집단의 특성을 파악하는 것을 통계적 추론이라고 한다.
알고자 하는 정보 모집단 표본 렘데시비르(Remdesivir)의 코로나(Covi...
#
데이터
#
표본
#
척도
#
질적
#
양적
#
순윕녀수
#
수치형
#
설명변수
#
비율변수
#
분석
#
범주형
#
반응변수
#
모집단
#
명목변수
#
등간변수
#
데이터과학
#
회귀
원문 링크 : [데이터 과학] 모집단과 표본, 설명변수와 반응변수