로딩
요청 처리 중입니다...

유튜브 스팸 댓글 분류 with.tidymodels

 유튜브 스팸 댓글 분류 with.tidymodels

이번 포스팅에서는 유튜브 댓글 데이터 셋을 이용하여 tidymodels 패키지로 텍스트 마이닝을 해볼 것이다. 첨부파일 Youtube-Spam-Dataset.csv 파일 다운로드 파일은 이거 쓰면 된다. 1.

변수 탐색 library(tidyverse) library(tidymodels) library(tidytext) library(textrecipes) text <- read_csv('Youtube-Spam-Dataset.csv') > str(text) spc_tbl_ [1,956 × 6] (S3: spec_tbl_df/tbl_df/tbl/data.frame) $ COMMENT_ID: chr [1:1956] "LZQPQhLyRh80UYxNuaDWhIGQYNQ96IuCg-AYWqNPjpU" "LZQPQhLyRh_C2cTtd9MvFRJedxydaVW-2sNg5Diuo4A" "LZQPQhLyRh9MSZYnf8djyk0gEF9BHDPYrrK-qCczIY8" "z13jhp0bxqncu51...