안녕하세요. SW 개발자 쪼맹 입니다.
오늘도 제가 알고 있는 소박한 지식을 공유 해보고자 합니다. 데이터 전처리 입니다.
[범주형 데이터 전처리] 범주형 데이터에는 명목형 자료와 순서형 자료가 있습니다. 저도 항상 헷갈리는 어려운 단어 인 것 같습니다.
명목형 자료는 nominal data 로 단순히 범주를 나타내는 데이터를 뜻 합니다. 값이 크고 작다는 개념이 없는 것 입니다.
예로 주민번호 / 혈액형 / 사번 등 을 생각 할 수 있습니다. 순서형 자료는 ordinal data 로 순서가 있는 데이터 입니다.
예로 학점 / 비만도 / 등급 등이 있을 것 같습니다. 범주형 데이터는 학습 데이터로 바로 이용할 수가 없습니다.
컴퓨터가 이해할 수 있는 데이터로 변환 되어야 합니다. 범주형 데이터를 전처리 한다고 하는데요.
Label encoding 과 One hot encoding 방법이 존재 합니다. Label encoding 은 범주 값을 숫자로 변환하는 것을 말합니다.
예로 혈액...
#
AI
#
딥러닝
#
머신러닝
#
머신러닝쪼렙
#
명목형
#
범주형
#
범주형데이터
#
순서형
#
왕초보AI
#
왕초보코딩
#
전처리
#
standardscaler
#
scaler
#
AI기초
#
DeepLearning
#
discretization
#
discretize
#
labelencoding
#
MachineLearning
#
minmaxscaler
#
onehotencoding
#
outlier
#
robustscaler
#
프로젝트
원문 링크 : [AI] 데이터 전처리 - 범주형 데이터(명목형, 순서형)