안녕하세요, 오늘은 개천절입니다. 개천절맞이 웹 크롤링의 기초 2번째 시간을 가져보려고 합니다.
우선 가장 기본적인 라이브러리를 설치 해 주어야겠죠. pip install beautifulsoup4 라이브러리 설치해주기 내가 파싱하고 싶은 페이지를 선택해 주어야겠죠. 저는 네이버 뉴스의 증권 부분을 한번 읽어 와 보겠습니다.
네이버의 경제뉴스에서 증권 부분 카테고리를 클릭합니다. 4만전자 초읽기가 보이시죠...미장으로 주식을 말아먹은 저로서는 정말...ㅠㅠㅠ안타깝습니다. 그럼 시작해 볼까요 2-1) 파싱할 부분의 URL을 작성해줍니다. 2-2) requests를 이용해 요청을 보내야겠죠 2-3) BeautifulSoup를 이용해 파싱을 시작합니다. requests.exceptions.ConnectionError: ('Connection aborted
.', ConnectionResetError(10054, '현재 연결은 원격 호스트에 의해 강제로 끊겼습니다', None, 10054, ...
#
news
#
파이썬
#
파이선독학
#
파이선
#
크롤링
#
카카오뷰
#
증권
#
서이추
#
미장
#
뉴스
#
네이버
#
국장
#
헤드라인뉴스