음성인식 - 자연어처리 - 해밍 거리 (Hamming Distance) 122회 컴퓨터 시스템 응용 1교시 4번 해밍거리 자연어 처리에서 Feature의 Vectorization을 수행할 때, Clustering시 데이터 간의 형태적 유사성(* 단어간 거리)를 계산하여 유사도를 평가할 때 사용하는 알고리.. charstring.tistory.com 현재는 Hamming Distance가 영상의 차이값을 확인하는 용도로 쓰이고 있는데, 이것으로 어떻게 유사한 영상인지를 검출하는 것인지 아직은 이론적으로 온전히 이해는 안갑니다. 코드를 보고는 있는데, 아무래도 원작자에게 도움을 요청해야만 할 것 같네요.
그것과는 별개로 Hamming Distance는 글자수가 같아야 하고, 영문에만 가능하다보니... 이럴 한국어에서의 차이점을 고려하되, 글자수가 다른 경우에도 비교를 하기 위한 레벤슈타인 거리(Levenshetein Distance)를 이용하는 포스팅까지 있어서 이렇게 긁어와봅니다.
L...
원문 링크 : 음성인식, 자연어처리 - 해밍거리