로딩
요청 처리 중입니다...

IRIS classification in R

 IRIS classification in R

IRIS에는 붓꽃의 종류가 있는데 R에서 붓꽃의 종류를 classification해보자. 사전 준비 필요한 데이터 패키지 및 iris 데이터를 불러오자.

데이터를 두가지로 나누었다. creatDataPartition은 caret패키지의 함수로, 주어진 비율(p)에 따라 데이터를 분할한다. list=FALSE이기 때문에 결과값은 벡터가 된다. 이후 test에는 data.split에 들어가지 않은 20%의 데이터를, dataset에는 80%의 데이터를 넣었다. dataset은 120*5의 행렬로 되어있다. sapply함수는 각 열에 대해서 특정 함수를 넣는 것이다.

예측하고자 하는 Species는 세가지이다. dataset에 적절하게 33.3%씩 각 Species가 들어가 있음을 볼 수 있다. 데이터 형성 x에는 1부터 4열 까지, y에는 5열을 넣었다.

이렇게 한 이유는 1부터 4열 까지는 numeric varibales로 independent variables기 때문이다. 반면 5번...

# CART # 코딩 # 붓꽃 # 분류 # 머신러닝 # 기계학습 # SVM # Rstudio # RF # resampling # R # LDA # KNN # iris # cv # classification # 통계학