안녕하세요. SW 개발자 쪼맹 입니다.
오늘도 제가 알고 있는 소박한 지식을 공유 해보고자 합니다. 이번에는 결정트리 (Decision Tree) 내용 중에 CART 에 대해서 알아보고자 합니다.
[CART] : Classification And Regression Tree (분류와 예측에 사용) : 지니지수가 작아지는 방향으로 모든 예측 변수를 (Feature) 사용하여 트리를 만들어가는 방법 입니다. scikit-learn은 CART 알고리즘을 통해 이진 트리를 만듭니다. (이진트리는 자식 노드가 두 개) 지니지수는 불순도를 나타내는 인덱스로 지니지수가 작아지는 형태로 Tree가 만들어진다고 볼 수 있습니다.
즉, 지니지수를 가장 작게 하는 예측 변수를 중요하다고 보고 해당 변수를 이용하여 정확도가 가장 높은 Tree를 만들어 나갑니다. 즉, A 라는 예측 변수를 이용했을 때는 지니지수가 0.5 인데 B라는 예측 변수를 이용하니 0.1 이 된다면 B라는 예측 변수를 이용하여 Tr...
#
AI
#
선형회귀식
#
선형회귀직선
#
설명변수
#
예측값
#
정답데이터
#
종속변수
#
지니지수
#
지도학습알고리즘
#
최소제곱법
#
추정값
#
프로젝트
#
학습데이터
#
선형회귀
#
반응변수
#
CART
#
DeepLearning
#
GINIINDEX
#
LinearRegression
#
MachineLearning
#
MSE
#
SSE
#
SSR
#
SST
#
독립변수
#
딥러닝
#
머신러닝
#
회귀직선