텍스트 마이닝이란? 텍스트 마이닝은 비정형 텍스트를 정형화하여 의미 있는 패턴과 새로운 인사이트를 찾아내는 프로세스이다.
텍스트 데이터 마이닝이라고도 불린다. 기업에서는 SVM, 기타 딥러닝 알고리즘과 같은 고급 분석 기술을 적용함으로써 비정형 데이터에 숨겨진 관계를 탐색하고 발견할수 있다.
비정형 데이터 마이닝의 유형 중 하나이다. 비정형 및 반정형 데이터에 대하여 자연어 처리 기술과 문서 처리 기술을 적용하여 유용한 정보를 추출, 가공하는 목적으로 한다.
실생활에서 만들어지는 대부분의 자료는 문서 형태인데, 여러 분야의 논문, 신문 또는 잡지의 기사, 여론조사, 콜센터의 전화 보고서, 이메일, 디지털 형태의 문서 등의 형태를 가지고 있다. 문서 형태의 데이터는 기존의 통계분석이나 데이터 마이닝 기법을 적용하기에 부적합한 데이터 형태를 가지고, 대부분 텍스트 데이터베이스에 저장된 데이터는 반 구조적 데이터이다.
이때 반부조적 데이터란 완전하게 구조적이지도 않고 완전하게 비구조적이지...
원문 링크 : 텍스트 마이닝이란? 적용 분야