F1 Score 개요 Classification에서 주로 사용하는 평가 지표는 여러가지가 있다. 대표적으로 사용하는 평가 지표는 바로 Accuracy이다.
Accuracy(정확도)는 데이터 셋 내에 클래스가 균일하게 분포되어 있는 경우에 유용한 평가 지표이다. 이말은 즉, 클래스가 불균형한 데이터 셋에 대해서는 좋지 않은 평가지표란 의미인데, 왜 불균형 데이터셋에서는 좋지 않은지 예를 들어보도록 하자.
우리가 정상 프로그램과 악성 프로그램을 분석하고 있으며 전체 프로그램 중 정상 프로그램이 전체의 99%를 차지하고, 악성 프로그램이 전체의 1%를 차지한다고 가정하자. 그리고 여기서 정상 프로그램과 악성 프로그램을 분류하는 모델을 구축한다고 해보자.
다만 모델이 잘 학습되지 않아서 프로그램 중 100%를 정상 프로그램으로 예측하며, 프로그램 중 0%를 악성 프로그램으로 예측하는 모델이 만들어졌다면 이 모델은 분명히 잘못되었고 쓸모없는 모델이다. 이 모델에 Train 시 사용했던 데이터...
원문 링크 : (데이터 과학) F1 Score