이번 포스팅에서는 나이브베이즈(Naivebayes)를 이용하여 분류작업을 수행하는 방법을 포스팅해볼 것이다. 나이브베이즈란?
베이즈 정리(Bayes’ theorem)는 18세기 영국의 목사이며 철학자인 토마스 베이즈(Thomas Bayes)가 제안한 조건부 확률에 대한 정리이다. 이는 아래와 같은 식으로 표현이된다.
우리가 만약 B가 발생한 상황에서 A과 B가 같이 발생할 확률 즉, 조건부 확률을 알고싶다고 해보자. 대표적으로 예를들수 있는 것이 스팸메일 분류법이다.
만약 메일이 왔을 때 '비아그라' 단어가 메일내용에 포함되어있을 때 이 메일이 스팸인지 아닌지 발생할 확률을 구하고 싶은것이다. 이 상황에서 P(B)는 '메일에 비아그라 단어가 포함될 확률'이고 P(A)는 메일이 스팸일 확률이고 P(A∩B)는 '메일에 비아그라 단어가 포함될 확률'이다.
위의 식을 이처럼 표현할 수 있다. 이 식은 P(A|B)를 P(B|A)의 형태로 나타냄으로써 P(A|B)의 확률을 계산할 수 있는 것이...
원문 링크 : 나이브베이즈를 이용한 분류