N사의 뉴스를 스크랩하여 원하는 결과를 추출해봤다 개발환경과 사용언어는 다음과 같다. 개발환경 사용 언어 및 도구 통합개발환경 인텔리제이 프레임워크 스프링부트 언어 및 라이브러리 자바, ojdbc8, json, selenium, thymeleaf, js, jquery 등 DBMS X 주 기능 소개 및 로직 설명 1.
입력 키워드를 통해 결과를 추출(콤마를 구분으로 여러단어 검색도 가능, 현재 키워드 검색 기준은 제목으로 세팅함) 2. 카테고리를 전체 또는 각 분야별로 설정해서 특정 분야만 스크랩도 가능 3.
제목 클릭 시 해당하는 뉴스 본문으로 사이트 이동 4. 게시일자를 오름차순, 내림차순 정렬 5.
파일 다운로드 : 결과물을 확장자 html로 내려받는다 (그냥 body 긁어오는거라 별 거 없음) N사 뉴스 스크랩 결과 요즘 핫한 아이폰에 대해 추출해봤다 아이폰 관련해서 기사들을 최근 게시한 순으로 뽑아오는 걸 알 수 있다 출력결과는 순번, 날짜, 분야, 제목, 이미지, 본문요약 ...
#
crawl
#
셀레니움
#
스크래핑
#
스크랩
#
스프링
#
웹드라이버
#
자동화
#
크론탭
#
크롤
#
크롤링
#
로봇
#
뉴스
#
crontab
#
driver
#
N사
#
robots
#
scrap
#
scrapping
#
selenium
#
spring
#
web
#
키워드
원문 링크 : N사 뉴스 스크래핑