로딩
티스토리 데이터 처리 중입니다.

ADSP 요약정리 - 3장 데이터 마트 - 데이터 가공

 ADSP 요약정리 - 3장 데이터 마트 - 데이터 가공

제 3절 기초분석 및 데이터 관리 1. 데이터 EDA - 데이터 분석 전에 대략적 특성을 파악하고 데이터에 대한 통찰을 얻기 위해 다각도로 접근 가.

데이터 기초통계 * head(iris) : 데이터 앞 6줄 보여줌 - head(iris,10) : 숫자 넣어주면 원하는 개수만큼 볼 수 있음. * str(iris) :데이터 구조 파악 * summary : 데이터 기초 통계량 * cor(x,y) : 상관계수 * cov(x,y) : 공분산 2. 결측값 처리 - 결측값 처리 시간 많이 쓰는 것은 비효율적 * 가능하면 결측값은 제외하고 처리하는 것이 적합 (결측값 자체가 의미 있는 경우 있음) - 결측값 어떻게 처리하냐는 전체 작업 속도에 많은 영향 * 이 부분을 자동화하면 업무 효율성 매우 향상됨 - R 결측값.....