이전 포스트에서 클래스 불균형 문제에 대해 Case를 들어보았다. 이제 다음의 해결책으로 한번 불균형 문제를 풀어볼 수 있다.
앞서 말한 case 1, 2에 대해서는 다음의 1, 2, 5번 솔루션을 사용해볼 수 있다. case 3에 대해서는 다음의 3, 4, 5번 솔루션을 사용해볼 수 있다. 1) Oversampling Minority class 수를 부풀려서 Majority class와 비슷한 수로 만드는 방법이다. Sampling을 하는 방법은 도메인마다 차이가 있을 것이다.
Vision 분야라면 Augmentation을 할 수도 있고, 자연어처리 분야라면 텍스트문장을 더 만들어낼 수 있다. 이때 주의할 점은 원래 가지고 있는 Minority의 성질을 그대로 가지고 있도록 Oversampling 하는 것이다. oversampling하는 방법 중, 성능이 어느정도 잘 나오는 방법이 있다.
Smote를 소개한다. smote는 데이터를 N차원에 그리고, Minor한 데이터를 유사하게 ...
#
Catastrophic_Forgetting
#
Class_imbalance
#
Focal_loss
#
Oversampling
#
Transfer_learning
#
Undersampling
#
Weight_balancing