이번에는 IRIS데이터를 이용하여 의사결정나무를 그려보자. 의사결정나무는 일종의 classification을 시행하는 것이다.
데이터 전처리 우선 iris데이터를 읽어주고, iris의 열의 이름을 간단하게 바꿔준다. party패키지 설치 party패키지를 설치하여 ctree()함수를 불러온다. 의사결정나무 그리기 위 의사결정 나무는 3개의 노드를 가지며 4개의 잎을 가진다. y값이 결과값이라고 볼 수 있는데, 이것을 해석하기 위해서는 먼저 unique(iris$sp)를 시행해보자.
그러면 y=(a,b,c)의 값중 a,b,c는 각각 setosa, versicolor, virginica를 의미함을 알 수 있게된다. 아니면 type을 extended로 해서 위와 같은 결과를 얻을 수 있게 된다.
결과를 보면 pl이 1.9이하인 경우 무조건 setosa이며, pl이 1.9보다 크고 pw가 1.7보다 큰 경우 (7번 leave) 0.978정도의 확률로 virginica가 된다....
#
decision
#
making
#
R
#
tree
#
의사결정나무
#
통계
원문 링크 : R을 이용한 의사결정 나무