안녕하세요 IT인플루언서 네실입니다. 오늘은 머신러닝 알고리즘의 성능 평가에 대해 이야기 해보려 합니다.
많은 분들이 머신러닝 모델의 성능을 평가할 때 '정확도(accuracy)' 하나만으로 판단하는 경우가 많습니다. 하지만 정확도만으로 모델의 성능을 평가하면 오히려 큰 문제가 발생할 수 있습니다.
이번 글에서는 정확도 외에도 고려해야 할 다양한 평가 지표와 그 중요성에 대해 상세하게 설명하겠습니다. 정확도의 한계 정확도는 전체 예측 중에서 올바르게 예측한 비율을 나타냅니다.
예를 들어, 100개의 데이터 중 90개를 맞췄다면 정확도는 90%입니다. 하지만 이 지표는 불균형 데이터셋에서 심각한 문제를 일으킬 수 있습니다.
불균형 데이터셋이란 특정 클래스가 다른 클래스보다 훨씬 많이 나타나는 데이터 세트를 말합니다. 간단히 예를 들어 보겠습니다.
암 진단 데이터에서 98%가 정상이고 2%만 암이라고 가정해봅시다. 모델이 모든 데이터를 정상이라고 예측해도 정확도는 무려 98%가 됩니다....
#
머신러닝
#
알고리즘
#
인공지능
#
혼돈해열