본문 바로가기
리뷰/도서

R을 이용한 퀀트 투자 포트폴리오 만들기 - Jpub(제이펍)

by Remover 2021. 2. 17.
반응형

<이 리뷰는 제이펍으로 부터 책을 지원 받아 작성되었습니다.>

 

책소개

일반 투자자도 따라 할 수 있는 금융 데이터 수집 및 포트폴리오 구성 방법!
금융 데이터 크롤링, 데이터 분석 및 시각화, 투자 종목 선정, 포트폴리오 구성, 백테스트 및 성과 평가

퀀트 투자를 하려면 먼저 투자에 필요한 주가, 재무제표 등의 데이터를 수집해 정리한 후 필요한 지표를 얻기 위해 가공합니다. 그후 각종 모형을 이용해 투자 종목을 선택하거나 백테스트를 수행하며, 이를 바탕으로 실제로 투자하고 성과를 평가합니다. 따라서 퀀트 투자는 데이터 과학을 금융에 응용한 사례라고도 볼 수 있으며, 퀀트 투자의 중심에는 데이터와 프로그래밍이 있으며, 이 책은 실제 퀀트 투자 매니저 출신이 데이터 크롤링부터 포트폴리오 구성까지 퀀트 투자의 정석을 설명하고 있습니다.

 

https://jpub.tistory.com/1131?category=208491

 

R을 이용한 퀀트 투자 포트폴리오 만들기(개정판)

일반 투자자도 따라 할 수 있는 금융 데이터 수집 및 포트폴리오 구성 방법! 금융 데이터 크롤링, 데이터 분석 및 시각화, 투자 종목 선정, 포트폴리오 구성, 백테스트 및 성과

jpub.tistory.com

 


이번에 리뷰하게 된 책은 퀀트 투자 포트폴리오 만들기 입니다.

최근 주식에 대한 열기가 뜨거운데요. 제 주변 분들도 모두 주식을 시작하셨다고들 하시고, 저 또한 주식투자를 시작하다보니 책을 리뷰하면서도 흥미가 생기는, 공부가 되는 그런 책이었습니다.

 

퀀트란?


퀀트란?

quantitative(계량적, 측정할 수 있는)와 analyst(분석가)의 합성어. 수학·통계에 기반해 투자모델을 만들거나 금융시장 변화를 예측하는 사람을 말한다. 이들은 컴퓨터 알고리즘을 설계해 투자에 활용한다. 컴퓨터 알고리즘에 기반한 퀀트 투자가 급증하는 가운데 헤지펀드들이 더 많은 소프트웨어 엔지니어를 고용하고 있다.

- 출처 네이버 지식백과 : https://terms.naver.com/entry.nhn?docId=3588009&cid=42107&categoryId=42107

 

퀀트 투자란, 데이터를 기반으로 투자를 하는 것을 말합니다. 기계적으로 투자를 하는 것인데요. 그렇기 때문에 데이터를 수집하고, 정제하고 가공하는 작업들이 이루어지게 됩니다. 책에서도 그런 내용들을 다루고 있습니다. Java, Python이 아닌 R을 통해 작업하는 내용을 담고 있습니다. 최근에는 Python에도 라이브러리들이 다수 존재하기 때문에 R을 통해 내용을 익히고 Python으로 구현해본다면 좋지 않을까 라는 생각이 들었습니다.

 

책은 기본적으로 R을 사용할 줄 아는 독자를 대상으로 하고 있습니다. R에 대해서 잘 모르기 때문에 기초지식을 공부하고 책을 읽다보니 읽는데 시간이 조금 걸렸던것 같습니다. R에 대한 기초 강의는 https://moon9342.github.io/R-lecture-R-environment 를 참고하셔서 공부하시면 좋을 것 같습니다!

 

책에도 적혀있듯이 R을 이용하기 때문에 파이썬 혹은 다른 언어를 사용하는 분들에게는 직접적으로 도움은 되지 않습니다. 다만 해당 지식을 사용하고 계신 언어에 대입하여 사용한다면 좋은 공부가 될 수 있을 것으로 생각됩니다.

 

크롤링, 데이터를 모아보자


 

퀀트 투자를 하기 위해서는 데이터가 필요합니다. 데이터를 모으기 위해 크롤링이라는 것을 진행합니다. 2장에서는 크롤링에 대한 내용을 다루고 있습니다. R을 통해 HTML을 파싱하는 방법에 대해서 배울 수 있습니다. 저 같은 경우 Java를 통해 크롤링하는 것이 편하여 자바를 통해서 작업을 진행하였습니다.

 

2장에 이어, 3장에서는 크롤링 뿐아니라 API를 통한 데이터 수집을 진행하게 됩니다. 퀀트 투자를 하기 위해서는 데이터가 중요하기 때문에 우리는 데이터 수집을 열심히 할 필요성이 있습니다. 가장 단순하지만 중요한 파트가 아닐까 생각됩니다.

 

크롤링을 하다보면 서버에 무리를 주게 되고, 이런 경우 Blocking이 될 수 있습니다. 따라서 조심히 수집해야하는데요. 크롤링 하기 전 사이트의 정책을 확인해볼 필요성이 있습니다. robots.txt, 로봇 배제 표준에 따라서 크롤링을 반대하는 것을 사이트마다 표시할 수 있습니다. 따라서 크롤링이 불가능한 사이트들은 수집에 주의할 필요성이 있습니다.

https://developers.google.com/search/docs/advanced/robots/create-robots-txt

모은 데이터 가공하기


7장에서부터는 앞에서 모은 데이터를 가공하기를 배우게 됩니다. 우리가 원하는 것은 종목선정일 텐데요. 해당 내용은 9장에서 다루게 됩니다. 데이터를 통해 주가를 정리하고, 재무제표 등을 정리하는 작업들을 진행하게 됩니다.

 

 

책 중간중간 어려운 수식들이 기다리고 있습니다. 책을 읽으면서 2~3번 다시 읽으며 책을 읽어나갈 정도로 조금은 어려운 수식들이 가득했습니다. 

 

수식들을 지나 차근차근 책을 따라하다보면 수집된 데이터를 통해 여러 차트들을 생성할 수 있습니다. 이런 차트들과 종목선정을 통해 직접 투자도 진행해보고, 수익률도 뽑아볼 수 있습니다. 데이터를 통해 종목을 선정함에 있어서 그 종목에 대한 투자의 책임은 본인에게 있습니다. 어느정도 조심하며 투자 할 필요성이 있어보입니다.(데이터를 무조건 신뢰 할 수 는 없다고 생각합니다.) 

 

퀀트 투자 포트폴리오 만들기 책을 통해 본인만의 포트폴리오를 만들어보셨으면 좋겠습니다.

댓글