차원축소알고리즘(Dimensionality reduction algorithms) 특성(feature)은 얼핏 보면 데이터의 다양한 측면을 보여주기 때문에 많을수록 좋은 것 같지만, 학습이 느려질 수 있고, 좋은 해를 찾는 데 방해가 되기도 한다. 특성의 수가 증가하는 것은 데이터의 수가 증가하는 것이 아닌 데이터를 표현하는 공간(차원)이 커지는 것으로도 말할 수 있다.
특성의 수가 증가할수록, 데이터의 차원 또한 커지기 때문에 이를 채우기 위한 데이터의 수도 증가하게 된다. 데이터의 크기는 같으나 특성이 많아지게 되면 적은 데이터로 공간을 표현해야 해서 과적합(Overfitting)이 발생할 수도 있다.
이러한 문제를 차원의 저주라고 한다. 이외에도 많은 특성을 가지게 되면 특성끼리 상관관계가 높은 다중 공산성의 문제가 있을 수 있고 알고리즘의 복잡성을 증가시켜 오히려 예측 성능을 낮아지게 된다.
이런 문제점들을 해결하기 위해 차원의 수를 줄이는 방법인 차원 축소 방법이 사용되고 ...
#
DimensionalityReduction
#
PCA
#
Principal
#
선형판별분석
#
인공지능
#
주성분분석
#
차원축소
#
특성선별