파이썬 BeautifulSoup 4 정리 (tag, id, class, find, findall, 등)
파이썬에서 HTML를 다루는 데는 BeautifulSoup가 대표적입니다. 물론 다른 파서도 있겠지만 가장 보편적으로 사용하는 것이 BeautifulSoup입니다. 크롤러에 보통 사용되고, 필요한 데이터를 추출하거나 모니터링하기 위해 원하는 HTML 코드를 가져올 수 있습니다. 설치 & 모듈 설명 이름은 굉장히 길지만 그냥 아름다운 수프로 기억하면 잊어버리진 않습니다. 설치 택 1 $ easy_install beautifulsoup4 $ pip install beautifulsoup4 bs4 모듈의 BeautifulSoup 클래스를 가져다 사용합니다. 그냥 사용하는 경우도 있고 별칭으로 간단하게 사용하는 경우도 있습니다. (복붙 중 SyntaxError: invalid character in identifier 에러가 발생하면 다 지우고 수동으로 입력해 주세요) from bs4 import BeautifulSoup # from bs4 import BeautifulSoup as Sou