기계학습 모델을 활용하여 어떤 값(=종속변수)을 예측하기 위한 모델을 만들기 위한 수식(Formula)는 아래와 같이 정의해볼 수 있다. ex) 피부색 ~ 나이 + 설문조사항목 + 임상정보 + 유전정보 이때 독립변수(=나이, 설문조사항목, 임상정보, 유전정보)가 어떤식으로 사용되는지 알아보기 위해 대표적인 모델 4가지의 수식은 아래와 같다. 1. Linear regression model 2.
SVM linear kernel model 3. PLS (Partial Least Squares) model 4.
Xgboost model xgboost의 경우 사용되는 파라미터에 대해서는 아래와 같다. best_nrounds = 모델 학습 시 지정한 최대 트리 개수(=반복 횟수) max_depth = 각 트리의 최대 깊이(=분기) eta = learning rate(=각 트리의 출력값에 0.1을 곱해 모델의 예측값에 반영) gamma = 성능 향상이 "gamma" 이상일 때, 새로운 깊이(=...
원문 링크 : 연속형 기계학습 모델 수식