로딩
요청 처리 중입니다...

최근접 이웃을 사용한 분류(k-nn분류 알고리즘)

 최근접 이웃을 사용한 분류(k-nn분류 알고리즘)

이번 포스팅에서는 k-nn알고리즘을 이용하여 데이터를 어떤 범주로 분류하는 방법을 포스팅해보겠다. k-nn알고리즘이란? -새로운 데이터가 입력이 되었을 때 새로운 데이터의 클래스(범주)를 해당 데이터와 가장 가까이 있는 k개 데이터들의 클래스(범주)로 결정하는 기법이다.

예를들어 밑에와 같은 그림이 있다고 해보면 우리의 궁금증은 그림에서 동그라미인 '?'가 세모, 네모 어느 클래스(범주)로 구분해야하는지 알고싶은 것이다.

여기서 주변에 있는 이웃의 개수를 k라고 했을 때 k=3으로 설정할 경우 동그라미와 가장 가까운 객체 3가지인 빨간색 삼각형 2개와 파란색 사각형 1개가 이웃이 되는 것이다. 여기서 다수결의 법칙에 의하여 빨간색 삼각형이 2개로 파란색 사각형보다 많기에 동그라미는 빨간색 삼각형으로 분류가 된다.

만약 k=5로 하게된다면 동그라미 주변에 빨간색 삼각형 2개 파란색 사격형 3개가 이웃이 된다. 이때는 다수결의 법칙에 의하여 파란색 사각형 3개가 빨간색 삼각형 2개보다 ...