이번 포스팅에서는 NBER 논문의 카테고리를 예측하는 모델링을 해 볼 것이다. 가중로그오즈로 텍스트의 빈도를 분석하는 방법과 종속변수 3개의 라쏘모형을 적합하는 방법을 알아보는게 메인 주제이다.
데이터불러오기 library(tidyverse) papers <- readr::read_csv("https://raw.githubusercontent.com/rfordatascience/tidytuesday/master/data/2021/2021-09-28/papers.csv") programs <- readr::read_csv("https://raw.githubusercontent.com/rfordatascience/tidytuesday/master/data/2021/2021-09-28/programs.csv") paper_authors <- readr::read_csv("https://raw.githubusercontent.com/rfordatascience/tidytuesday/mast...
원문 링크 : 가중로그오즈와 다중클래스 예측