로딩
티스토리 데이터 처리 중입니다.

ADSP 요약정리 - 3장 데이터 마트 - 데이터 가공

 ADSP 요약정리 - 3장 데이터 마트 - 데이터 가공

제 2절 데이터 가공 1. Data Exploration * summary : 데이터가 어떻게 분포돼 있는지 보여줌 - 디멘젼 변수 : 각 멤버의 갯수, 결측치 개수 ( NA's) - 메져변수 : 최소값(Min), 1st Q(1사분위값) , 중앙값(Median), 평균값(Mean), 3rd Q(3사분위값), 최대값(Max), 결측치 개수(NA's) * plot : 차트 2.

변수중요도 - 개발중인 모델에 준비된 데이터를 기준으로 한버에 여러개의 변수를 평가 * 변수 중요도 평가 :패키지로 평가, 모델링 실행해 평가 * 모델링 실행 결과 (Decision Tree)로 의미 있는 것들에 대해 변수 중요도 파악이 일반적 * 휴면고객 분류 모델개발: 특성 유사한 것 끼리 그룹 만들어 실행 후 모아 최종 모델 개.....