제 2절 분류분석 (Classification Analysis) 1. 분류모델링 - 분류분석 : 데이터의 실체가 어떤 그룹에 속하는지 예측하는데 사용하는 데이터 마이닝 기법 * 특정 등급으로 나누는 점에서 군집분석과 유사하나 각 계급이 어떻게 정의 되는지 미리 알아야 함. - 분류(Classification) : 객ㅊ를 정해놓은 범주로 분류하는데 목적 * CRM에서는 고객행동예측, 속성파악에 응용.
다양한 분야에서 활용 가능 - 많은 경우 분류모델 개발할 때는 train data/ test data 구분지어 모델링 * 전체 데이터를 7:3, 8:2 등으로 나눠 train 해서 최적모델 확정짓고 test로 검증 * train과 test간 편차 없어야 하며 성능은 test가 다소 낮게 나오는 경향 - 분류를.....