글은 사람의 감정을 대변하는 좋은 도구이다. 그렇기에 최근 많은 연구에서 글, 특히 소셜 미디어의 영상이나 글의 반응을 실시간으로 파악할 수 있는 "댓글 기반의 분석"을 많이 진행하고 이를 근거로 연구를 진행하고 있다.
그렇기에 오늘은 텍스트 데이터의 숨겨진 주제 구조를 찾아주는 LDA(잠재 디리클레 할당) 토픽 모델링을 진행하여, 실제 분석할 수 있는 코드에 대해 알아보도록 해보겠다. 바로 시작해보자아~ ### 오늘은 LDA 토픽 모델을 진행합니다. ### 파이썬 기반의 코드 작성을 진행합니다. ### 데이터는 임의로 생성한 데이터로 진행합니다.
LDA에 대해 먼저 공부를 해보고 싶다면 아래 링크를 참고해보자. https://wikidocs.net/30708#:~:text=%ED%86%A0%ED%94%BD%20%EB%AA%A8%EB%8D%B8%EB%A7%81%EC%9D%80%20%EB%AC%B8%EC%84%9C%EC%9D%98,%EC%A4%91%EC%9A%94%ED%95%9C%20...