로딩
요청 처리 중입니다...

[머신러닝] Clustering – 지도 없이 찾는 데이터의 무리

 [머신러닝] Clustering – 지도 없이 찾는 데이터의 무리

“이 데이터들, 비슷한 애들끼리 좀 묶어줘봐.” 바로 이런 명령을 수행하는 것이 머신러닝의 Clustering (군집화) 입니다.

라벨 없이 데이터를 분류하는 비지도 학습(Unsupervised Learning)의 대표 주자죠. Clustering이란?

Clustering(군집화)은 이름 그대로, 데이터를 유사한 특성끼리 그룹화하는 작업입니다. 사람이 미리 정해준 정답(라벨)이 없기 때문에, 모델은 스스로 구조를 파악해야 합니다.

예를 들어… 고객을 쇼핑 성향에 따라 분류 뉴스 기사를 주제별로 자동 분류 이미지 속 픽셀을 색상별로 그룹화 목적은? 데이터의 구조 파악 라벨링이 없는 데이터를 자동 분류 이상치 탐지 (어느 군집에도 잘 속하지 않는 데이터) 대표 알고리즘들 1.

K-Means Clustering 가장 유명하고 직관적인 방법 K개의 중심점(centroid)을 지정하고, 가장 가까운 중심에 데이터를 할당 중심점은 반복적으로 업데이트됨 from sklearn.cluster...