파이썬이나 R을 이용한 퀀트 투자 전략을 소개하는 책들을 몇 권 읽으면서 의아하게 느낀 점이 있습니다. 책의 상당 분량을 웹 크롤링으로 데이터를 수집하는 방법을 소개하는데 할당한다는 점입니다.
웹 크롤링을 이용하여 데이터를 수집하는 방식은 서비스를 제공하는 기관이 웹 페이지를 개편하면 이를 반영하여 수정하여야 합니다. 또한 전 기간 데이터를 가져오는데 상당한 시간이 소요되기에, 자체적으로 데이터베이스를 구축하고 주기적으로 최근 데이터를 구해 업데이트해야 합니다.
이런 이유로 이러한 책들은 간단하게나마 데이터베이스를 구축하여 관리하는 방법까지 함께 소개하는 경우가 흔합니다. yfinance 라이브러리를 이용한 주가 데이터 조회 예 전 세계 주식 데이터를 조회할 수 있는 Yahoo Finance 데이터의 경우 파이썬이나 R로 접근할 수 있는 간편한 라이브러리가 여러 가지 있습니다. (라이브러리 내부적으로는 웹 크롤링을 쓸 수 있습니다) 예를 들어 파이썬의 yfinance 라이브러리를 이...