로딩
요청 처리 중입니다...

파이썬 웹 크롤링의 기초(2) - BeatifulSoup 이용하기

 파이썬 웹 크롤링의 기초(2) - BeatifulSoup 이용하기

안녕하세요, 오늘은 개천절입니다. 개천절맞이 웹 크롤링의 기초 2번째 시간을 가져보려고 합니다.

우선 가장 기본적인 라이브러리를 설치 해 주어야겠죠. pip install beautifulsoup4 라이브러리 설치해주기 내가 파싱하고 싶은 페이지를 선택해 주어야겠죠. 저는 네이버 뉴스의 증권 부분을 한번 읽어 와 보겠습니다.

네이버의 경제뉴스에서 증권 부분 카테고리를 클릭합니다. 4만전자 초읽기가 보이시죠...미장으로 주식을 말아먹은 저로서는 정말...ㅠㅠㅠ안타깝습니다. 그럼 시작해 볼까요 2-1) 파싱할 부분의 URL을 작성해줍니다. 2-2) requests를 이용해 요청을 보내야겠죠 2-3) BeautifulSoup를 이용해 파싱을 시작합니다. requests.exceptions.ConnectionError: ('Connection aborted

.', ConnectionResetError(10054, '현재 연결은 원격 호스트에 의해 강제로 끊겼습니다', None, 10054, ...

# news # 파이썬 # 파이선독학 # 파이선 # 크롤링 # 카카오뷰 # 증권 # 서이추 # 미장 # 뉴스 # 네이버 # 국장 # 헤드라인뉴스