로딩
요청 처리 중입니다...

텍스트마이닝과 데이터마이닝의 차이, 데이터분석 관점에서 정리

 텍스트마이닝과 데이터마이닝의 차이, 데이터분석 관점에서 정리

데이터를 공부하다 보면 비슷한 단어 때문에 잠깐 멈추는 순간이 생깁니다. “텍스트마이닝”과 “데이터마이닝”이 특히 그렇습니다.

저도 처음에는 같은 범주로 묶어 이해했는데, 실제로 프로젝트를 해보니 시작점부터 접근이 달라서 혼동이 줄었습니다. 오늘은 데이터분석 관점에서 두 개념을 분리해 정리하고, 어떤 상황에서 무엇을 선택하면 좋은지도 함께 정리해보겠습니다.

데이터마이닝은 정형 데이터에서 규칙을 찾는 흐름으로 보면 편합니다 데이터마이닝은 표 형태로 정리된 데이터에서 의미 있는 패턴을 찾는 과정에 가깝습니다. 매출, 구매 이력, 방문 횟수처럼 숫자와 범주형 값으로 구성된 자료가 대표적입니다.

이런 데이터는 구조가 이미 잡혀 있어, 분석 목표가 정해지면 모델링 단계로 자연스럽게 넘어가곤 합니다. 제가 처음 맡았던 이탈 예측 작업도 비슷했는데, 나이·구매 빈도·결제 금액 같은 값들이 열로 정리되어 있어서 변수 선택과 모델 비교에 집중할 수 있었습니다.

이때는 분류, 군집화, 회귀 같은 알고...