IRIS에는 붓꽃의 종류가 있는데 R에서 붓꽃의 종류를 classification해보자. 사전 준비 필요한 데이터 패키지 및 iris 데이터를 불러오자.
데이터를 두가지로 나누었다. creatDataPartition은 caret패키지의 함수로, 주어진 비율(p)에 따라 데이터를 분할한다. list=FALSE이기 때문에 결과값은 벡터가 된다. 이후 test에는 data.split에 들어가지 않은 20%의 데이터를, dataset에는 80%의 데이터를 넣었다. dataset은 120*5의 행렬로 되어있다. sapply함수는 각 열에 대해서 특정 함수를 넣는 것이다.
예측하고자 하는 Species는 세가지이다. dataset에 적절하게 33.3%씩 각 Species가 들어가 있음을 볼 수 있다. 데이터 형성 x에는 1부터 4열 까지, y에는 5열을 넣었다.
이렇게 한 이유는 1부터 4열 까지는 numeric varibales로 independent variables기 때문이다. 반면 5번...
#
CART
#
코딩
#
붓꽃
#
분류
#
머신러닝
#
기계학습
#
SVM
#
Rstudio
#
RF
#
resampling
#
R
#
LDA
#
KNN
#
iris
#
cv
#
classification
#
통계학
원문 링크 : IRIS classification in R