로딩
요청 처리 중입니다...

[필기] Decision Tree 모델_머신러닝

 [필기] Decision Tree 모델_머신러닝

의사결정나무(Decision Tree) 정의 의사 결정 규칙과 그 결과물들을 트리 구조로 도식화한 것 요소 : 뿌리 마디, 중간 마디, 끝 마디, 깊이 뿌리마디 : 트리가 시작되는 마디로 전체 데이터로 이루어져 있따. 중간마디 : 중간에 위치한 마디들 끝마디 : 트리 구조의 끝에 위치한 마디들로 더 이상 추가적으로 노드가 생기지 않는다.

깊이 : 뿌리 노드에서 끝 마디까지의 노드 개수 장점 모델의 예측 결과를 해석하고 이해하기 쉬움 데이터 가공할 필요가 거의 없음 단점 연속형 변수를 범주형 값으로 취급하기 때문에 예측의 오류가 클 수 있음 노이즈 데이터에 영향을 크게 받음 과적합 문제가 발생하기 쉬움 의사결정나무 알고리즘 CART (Classification and RegressionTree)알고리즘으로 각 분할에서 정보 이득을 최대화하는 것으로 즉, 불순도를 감소하는 것이다. 불순도 (정보 이득): 정답이 범주형이면 : 엔트로피 지수, 지니 지수 정답이 연속형이면 : MSE를 이용...

# CART # DecisionTree # entropy # 의사결정나무 # 지니지수