"데이터는 많고, 해석은 어렵다." 요즘 데이터는 수천 개의 특성(피처)을 가진 고차원 덩어리입니다.
그런데 알고 보면 이 모든 특성이 꼭 필요하지는 않죠. 그래서 등장한 것이 바로 차원 축소(Dimension Reduction)입니다.
차원 축소란? 차원 축소(Dimension Reduction)는 원래의 고차원 데이터를 더 적은 차원의 데이터로 변환하는 과정입니다.
예를 들어, 100개의 특성을 가진 데이터를 2~3개의 주요 특성으로 줄이는 것. 줄이긴 했지만, 데이터의 핵심 구조나 정보는 최대한 보존하는 게 목표입니다.
왜 차원을 줄여야 할까? 고차원일수록… 시각화가 어려움 (2D/3D만 사람이 직관적으로 해석 가능) 계산량 폭증 (속도 느려짐) 노이즈 포함 가능성 증가 차원의 저주(Curse of Dimensionality) 발생 차원이 늘수록, 데이터 간 거리는 비슷해지고 군집화나 분류가 어려워집니다.
차원 축소의 목적 목적 설명 시각화 2D/3D로 투영해서 군집 구...