DBSCAN : Density-Based Spatial Clustering of Applications with Noise 데이터 밀도 기반 클러스터 구성 알고리즘. 밀도가 높은 데이터 포인트들이 클러스터를 형성 낮은 밀도 영역은 잡음(Noise) 로 간주.
클러스터 개수 미리 지정 필요 없음. 데이터 분포에 따라 클러스터의 모양, 크기 다양하게 형성.
과정 입실론-이웃 설정 알고리즘 핵심 매개변수는 입실론-이웃 크기임. 주어진 데이터 포인트의 주변 반경을 결정하는 파라미터.
최소 데이터 포인트 개수 (minPts) 지정 필요 핵심포인트 (Core Point) 탐색 각 데이터 포인트에 대해 입실론반경(입실론이웃) 내 최소 데이터 포인트 개수 이상의 데이터 포인트가 존재하는지 확인. 이는 핵심포인로 간주.
직접 접근선 (Direct Density Reachability) 검사 핵심포인트 간 직접 접근성 검사하여 클러스터 형성 두 핵심포인트가 서로 입실론반경 내 있으면 서로 접근 가능하...
원문 링크 : 클러스터링(Clustering) - DBSCAN