머신러닝으로 당뇨병 진단 결정 트리(DecisionTree) 모델링 하는 방법에 대해 포스팅합니다. 1. 데이터 불러와 DataFrame 생성 1) 필요한 라이브러리를 import 해옵니다. 2) DataFrame을 생성 당뇨병 데이터를 가진 csv 파일을 불러와 DataFrame으로 변환합니다. df=당뇨병 정보가 있는 데이터 프레임 해당 데이터는 70,692개의 행과 22개의 column이 있는 빅데이터로, 당뇨병 환자들을 대상으로 당뇨병에 영향을 주는 여러 요소들에 대해 설문조사한 결과입니다.
이 데이터를 가지고 머신러닝을 이용해 해당 칼럼의 요소(고혈압, 고지혈증, bmi 등)을 제시할 때 대상자가 당뇨병 인지 진단해 주는 모델을 만들어 보려 합니다. 2. 데이터 전처리 1) 누락값 확인 df.info( ) 함수를 이용하여 해당 컬럼 중 누락값이 있는지 확인합니다. 22개의 column모두 70692개의 값을 가지므로 누락값은 없는 상태입니다. 2) 이상치 확인 위에서 제시된...
#
decisiontree
#
결정트리
#
진단알고리즘
#
머신러닝독학
#
전진제거법
#
모델링함수
#
모델링방법
#
머신러닝함수
#
머신러닝파이썬
#
머신러닝모델링
#
머신러닝
#
후진제거법