이번 포스팅에서는 계층형군집분석의 알고리즘을 이용하여 군집을 형성하는 방법을 포스팅해볼 것이다. 군집화(clustering)란?
군집화란 소속 집단의 정보가 없는 상태에서 비슷한 집단으로 묶는 비지도 학습의 한 종류이다. 많은 사람들이 분류와 군집화를 헷갈려한다.
분류(classification) : 소속집단의 정보를 이미 알고 있는 상태에서, 새로운 데이터가 들어왔을 때 이 데이터를 비슷한 집단으로 묶는 지도 학습 즉, 분류(classification)은 데이터가 들어왔을 때 비슷한 성질을 갖고있는 집단으로 분류하는 것으로 지도학습이다. 군집화(clustering)은 아무런 정보가 없는 데이터 상태에서 비슷한 성질을 갖고있는 집단으로 묶는 것으로 비지도 학습이다.
군집분석은 군집의 개수나 구조에 관한 특별한 가정없이 개체들 사이의 유사성 또는 거리(비유사성)에 근거하여 자연스러운 군집을 찾고 다음 단계에서 분석을 꾀하는 탐색적인 통계분석 기법이다. 분류에 대해서는 저번에 k-nn ...
원문 링크 : 계층형 군집생성방법