로딩
요청 처리 중입니다...

[AI] 데이터 전처리 - 범주형 데이터(명목형, 순서형)

 [AI] 데이터 전처리 - 범주형 데이터(명목형, 순서형)

안녕하세요. SW 개발자 쪼맹 입니다.

오늘도 제가 알고 있는 소박한 지식을 공유 해보고자 합니다. 데이터 전처리 입니다.

[범주형 데이터 전처리] 범주형 데이터에는 명목형 자료와 순서형 자료가 있습니다. 저도 항상 헷갈리는 어려운 단어 인 것 같습니다.

명목형 자료는 nominal data 로 단순히 범주를 나타내는 데이터를 뜻 합니다. 값이 크고 작다는 개념이 없는 것 입니다.

예로 주민번호 / 혈액형 / 사번 등 을 생각 할 수 있습니다. 순서형 자료는 ordinal data 로 순서가 있는 데이터 입니다.

예로 학점 / 비만도 / 등급 등이 있을 것 같습니다. 범주형 데이터는 학습 데이터로 바로 이용할 수가 없습니다.

컴퓨터가 이해할 수 있는 데이터로 변환 되어야 합니다. 범주형 데이터를 전처리 한다고 하는데요.

Label encoding 과 One hot encoding 방법이 존재 합니다. Label encoding 은 범주 값을 숫자로 변환하는 것을 말합니다.

예로 혈액...

# AI # 딥러닝 # 머신러닝 # 머신러닝쪼렙 # 명목형 # 범주형 # 범주형데이터 # 순서형 # 왕초보AI # 왕초보코딩 # 전처리 # standardscaler # scaler # AI기초 # DeepLearning # discretization # discretize # labelencoding # MachineLearning # minmaxscaler # onehotencoding # outlier # robustscaler # 프로젝트