로딩
요청 처리 중입니다...

BDAA 파이썬 판다스 문자 빈도수 세기

 BDAA 파이썬 판다스 문자 빈도수 세기

오늘은 BDAA에서 수업에서 나갔던, 내가 풀지 못했던 문자 빈도수 세기를 다시 풀어보겠다. 오늘은 특이하게 줌 수업에서 팀플을 했었다.

다만, 짧은 시간 내에 코드를 써야하는 과제였는데 나는 약간 대화하면서 코드짜는 거는 잘 못하는 타입이라 바로 풀어내지는 못했다 ,,,, 자, 그럼 풀어보자! import pandas as pd import string 우선 판다스와 글에서 특수문자를 없애줄때 사용할 string을 임포트해보자.

이후, spam데이터를 이용해보자. 스팸 데이터는 여기서 다운로드 가능해요!

첨부파일 spam.csv 파일 다운로드 spam = pd.read_csv('C:/Users/User/workspace/BDAA/data/spam.csv', index_col = 0) spam 확인해보니, 약 5500개 정도의 로우가 존재한다. 컬럼은 target과 text인 것 같다.

확인해보면 text의 로우마다 특수문자들이 존재한다. 단어 빈도수 세는데에 특수문자는 필요없다. ...

# bda # 데이터전처리 # 브다 # 빅데이터 # 빅데이터분석학회 # 빈도수 # 시각화 # 전처리 # 차트 # 데이터시각화 # 데이터분석 # 데이터공부 # bdaa # bigdata # data # pd # python # spam # 공부 # 데이터 # 파이썬