이 책은 금융권에서 AI를 활용하는 금융 전문가를 위한 인공지능 활용 실전 지침서다. 책의 초반부에서는 지도 학습, 초지능 등 일반적으로 활용되는 AI의 핵심 개념을 소개한다. 그다음 AI를 이용해 금융 시장에서 통계적 비효율성을 찾아내는 방법으로 내용을 확장한다. 그리고 어디에서도 배울 수 없는 통계적 비효율성에 AI 알고리즘을 더해 알고리즘 트레이딩에서 경제적 비효율성을 역이용하는 방법을 설명한다. 마지막으로 신경망 훈련을 위한 파이썬 코드 예제와 금융 시계열 예측을 소개하며 이 책을 마무리한다. 이 책을 따라 모든 학습을 마치고 나면 AI를 활용해 기존의 금융 시스템에 디지털 혁신을 가져올 금융 전문가로 거듭나 있는 자신을 발견하게 될 것이다.
AI와 초지능에서 활용되는 AI의 핵심 개념과 알고리즘
데이터 기반 금융, AI, 머신러닝이 금융 이론과 실무에 영향을 미치는 이유
신경망과 강화 학습을 금융 시장의 통계적 비효율성에 적용
백테스팅과 알고리즘 트레이딩을 통해 경제적 비효율성 활용
저자소개
저자
이브 힐피시
The Python Quants의 설립자이자 이사이며, Python Quants LLC의 공동 창업자이다. 이 회사들은 파이썬 기반의 금융 및 파생 상품 분석 소프트웨어와 파이썬 및 금융과 관련된 컨설팅, 개발, 교육 서비스를 제공한다. 금융 수학을 전공했고, 경영학 박사 학위를 받았으며 자를란트 대학교
에서 계산금융의 수치적 방법론을 가르치고 있다. 저서로는 『파이썬을 활용한 금융 분석』(한빛미디어, 2016), 『파이썬을 이용한 알고리즘 트레이딩』(제이펍, 2021), 『Derivatives Analytics with Python』(Wiley, 2015) 등이 있다.
카이스트에서 자동 제어와 신호 처리를 전공했고 박사 학위를 받았다. 박사 학위 과정 중에 처음 파이썬을 접했으며 시간이 날 때마다 파이썬을 활용했다. LG전자와 대우증권에서 파생 상품 프라이싱 시스템, 금융 정보 모니터링 시스템, 알고리즘 트레이딩 시스템 등을 파이썬으로 구현했다. 현재는 파이썬 기반 금융 분석, 최적 집행용 소프트웨어와 서비스를 만들고 있으며, 금융 분석 분야에서 파이썬이 더 널리 퍼질 수 있게 도울 수 있는 징검다리가 되고자 강의를 하고 있다.
오늘날 인공지능과 머신러닝은 금융 데이터의 프로그래밍적 가용성과 결합되면서 금융 산업의 패러다임을 바꾸고 있다. 이러한 흐름에 따라 인공지능과 머신러닝을 금융 분야에 적용하려는 책들이 많이 출간되었다. 하지만 이 분야의 연구가 아직 초기 단계이다보니 적절한 이론적 기반이나 경험적 증거가 부족한 경우가 허다하다.
이 책은 그간의 책들과는 다르게, 인공지능 기반 알고리즘 트레이딩 전략을 개발부터 백테스팅, 배포까지의 모든 내용을 제공한다. 책에서 소개하는 방법론과 예제 대부분은 수십 년간 저자가 쌓아온 연구에 기반한 것이다. 단순히 기술적 매매나 투자 방법론에 머신러닝과 인공지능을 적용하여 투자 수익률을 높이는 방법에만 집중하지 않는다. 파이썬을 활용해 금융 분야의 핵심 이론이 어떻게 형성되어 왔으며, 머신러닝과 인공지능을 활용하여 이론이 지닌 부족함을 어떻게 보완할 수 있는지 설명한다. 또한 인공지능과 머신러닝을 활용해 금융시장의 통계적 비효율성을 발견하고 알고리즘 트레이딩을 활용하는 방법에 대해 배울 수 있다. 머신러닝과 딥러닝 알고리즘을 금융에 적용하려고 시도하는 모든 이에게 훌륭한 안내서가 되어줄 것이다.
추천사
금융 분야에서 AI를 포괄적이고 직관적인 접근법으로 설명하여 금융 전문가와 학자들에게 좋은 참고자료가 될 것이다.
_아프둘라 카라잔(데이터 과학자)
정량적 금융공학에서 다양한 문제를 해결하고자 하는 머신러닝 실무자들에게 훌륭한 안내서가 되어줄 것이다.
들어가기에 앞서 이 책의 가장 훌륭한 점은 책에 나온 예제를 그대로 학습할 수 있는 JupyerLab을 무료로 제공한다는 점입니다.
다만 JupyterLAB에서는 조금 느리거나 답답할 수 있으니, 코드를 다운 받아서 로컬에서 돌려본는 방법도 추천합니다. 책에서는 파이썬 3.8로 되어 있지만, 최신 버전인 3.11에서도 무리 없이 동작하는 것을 확인 할 수 있었습니다.
전체적으로 책의 내용이 복잡한 수식과 프로그래밍에 대한 선수 학습이 필요하지만, 실습예제를 따라서 진행하다보면 배경지식이 없더라도 이해하는데 크게 무리는 없습니다.
파트 1에서는 기계지능에 대하여 폭넓게 다룹니다. 인공지능에 대한 역사와 초지능에 대한 이야기를 다루며, 최근에(이라 하지만 8년전 이야기인) 가장 충격을 주었던 딥마인드와 알파제로의 성공 사례를 다룹니다. 앞으로의 인공지능은 각 분야에서 어떻게 성장할 수 있을지 생각해보는 것도 좋을 것 같습니다.
파트 2에서는 금융과 머신러닝을 다룹니다. 기존의 금융 이론에 대한 설명 및 이에 따른 수식과 프로그램으로 어떻게 구현을 할 수 있는지에 대하여 다룹니다.
이와 같은 방식으로 다루는 이론은 "기대효용 이론", "평균-분산 포트폴리오 이론", "자본자산 가격결정 모형", "차익거래 가격결정 이론" 등을 다룹니다.
이 책의 마지막 파트에서는 금융 분야에서 인공지능을 널리 채택할 때 발생할 수 있는 결과에 대한 전망을 보여줍니다. 이 책에서는 매매에 대하여만 다루지만, 실제로 금융에서 적용할 수 있는 분야는 "신용평가", "부정 적출", "포트폴리오 관리" 등 다양하게 다룰 수 있습니다. 그리고 인공지능 금융에 대하여는 제대로 된 표준이 아직 확립이 되지 않았기 때문에, 오히려 경쟁 환경에서 인공지능 우선 금융의 이점을 활용할 수 있습니다.
책에 대한 내용은 더할나위 없이 훌륭합니다. 하지만 늘 아쉬운 점은 국내 주식시장(모두들 Hell이라고 부르는...) 에 적용시키기에는 조금 넘어야 할 난관이 많다는 점입니다. 개인적으로 동 출판사에서 나온 "파이썬 증권 데이터 분석"이 이러한 가려움을 긁어주는 책이라고 생각하는데, 개정판이 나왔으면 하는 생각입니다.
이 책은 각 챕터마다 참고문헌이 따로 정리되어 있어서, 금융공학을 전공하는 분들에게는 거의 필독서가 아닐까 싶습니다.
이 책을 지은 저자는 이브 힐피시 이사인데 The Python Quants의 설립자이자 이사이며, Python Quants LLC의 공동 창업자이다. 이 회사들은 파이썬 기반의 금융 및 파생 상품 분석 소프트웨어와 파이썬 및 금융과 관련된 컨설팅, 개발, 교육 서비스를 제공한다. 금융 수학을 전공했고, 경영학 박사 학위를 받았으며 자를란트 대학교에서 계산금융의 수치적 방법론을 가르치고 있다. 저서로는 『파이썬을 활용한 금융 분석』(한빛미디어, 2016), 『파이썬을 이용한 알고리즘 트레이딩』(제이펍, 2021), 『Derivatives Analytics with Python』(Wiley, 2015) 등이 있다. 이 책의 옮긴이 김도형 역자는 소문난 명강의 김도형의 데이터 사이언스 스쿨의 저자이고 https://datascienceschool.net/ 을 운영하고 있고 카이스트에서 자동 제어와 신호 처리를 전공했고 박사 학위를 받았다. 박사 학위 과정 중에 처음 파 이썬을 접했으며 시간이 날 때마다 파이썬을 활용했다. LG전자와 대우증권에서 파생 상품 프라이 싱 시스템, 금융 정보 모니터링 시스템, 알고리즘 트레이딩 시스템 등을 파이썬으로 구현했다. 현재 는 파이썬 기반 금융 분석, 최적 집행용 소프트웨어와 서비스를 만들고 있으며, 금융 분석 분야에서 파이썬이 더 널리 퍼질 수 있게 도울 수 있는 징검다리가 되고자 강의를 하고 있다. 예전에 pycon korea 2016에서 발표할 때 한번 본 적이 있다.
이 책을 파이썬을 모르는 독자들이 읽기에는 무리가 있다. 또한 금융을 모르는 독자도 읽기 어렵다. 예를 들면 거시경제 지표를 처리하는 데이터를 설명할 때 다중공선성이라는 단어를 쓰는 데 https://datascienceschool.net/03%20machine%20learning/06.04%20%EB%8B%A4%EC%A4%91%EA%B3%B5%EC%84%A0%EC%84%B1%EA%B3%BC%20%EB%B3%80%EC%88%98%20%EC%84%A0%ED%83%9D.html
위 주소에 가면 "다중공선성(multicollinearity)란 독립 변수의 일부가 다른 독립 변수의 조합으로 표현될 수 있는 경우이다. 독립 변수들이 서로 독립이 아니라 상호상관관계가 강한 경우에 발생한다. 이는 독립 변수의 공분산 행렬이 full rank 이어야 한다는 조건을 침해한다." 라고 자세히 설명을 해 놓았다.
하지만 당연하게도 선형대수와 통계를 조금이라도 알아야 독립 변수나 공분산 행렬이 어떤 것인지를 알것이다.
너무 길게 설명했는데 한마디로 이 책은 중급자를 위한 책이다.
오늘날 인공지능과 머신러닝은 금융 데이터의 프로그래밍적 가용성과 결합되면서 금융 산업의 패러다임을 바꾸고 있다. 이러한 흐름에 따라 인공지능과 머신러닝을 금융 분야에 적용하려는 책들이 많이 출간되었다. 하지만 이 분야의 연구가 아직 초기 단계이다보니 적절한 이론적 기반이나 경험적 증거가 부족한 경우가 허다하다. 이 책은 그간의 책들과는 다르게, 인공지능 기반 알고리즘 트레이딩 전략을 개발부터 백테스팅, 배포까지의 모든 내용을 제공한다. 책에서 소개하는 방법론과 예제 대부분은 수십 년간 저자가 쌓아온 연구에 기반한 것이다. 단순히 기술적 매매나 투자 방법론에 머신러닝과 인공지능을 적용하여 투자 수익률을 높이는 방법에만 집중하지 않는다. 파이썬을 활용해 금융 분야의 핵심 이론이 어떻게 형성되어 왔으며, 머신러닝과 인공지능을 활용하여 이론이 지닌 부족함을 어떻게 보완할 수 있는지 설명한다. 또한 인공지능과 머신러닝을 활용해 금융시장의 통계적 비효율성을 발견하고 알고리즘 트레이딩을 활용하는 방법에 대해 배울 수 있다. 머신러닝과 딥러닝 알고리즘을 금융에 적용하려고 시도하는 모든 이에게 훌륭한 안내서가 되어줄 것이다.
즉 여기서 언급하는 금융에 대한 내용은 일반적으로 개미투자자들이 생각하는 금융이 아니다. 다시 말해, 딥러닝 기반 투자를 통해 내 자산을 불리고자 하는 독자를 위한 책이 아니다. 거시 경제 측면에서 데이터를 어떻게 분석해야 하는가를 다루는 심오한 책이다. 이 책은 은행이나 증권사, 혹은 금융SI에서 업무를 하고자하는 금융IT 직종의 취업을 희망하는 자 또는 신입개발자들이 알아야 하는 내용에 대해서 금융의 차익거래 가격결정이론부터 시작해서 딥러닝까지 하나하나 단계를 밟아가는 책이다.
결론을 얘기하자면 투자 방법만 얘기하는 내용으로 가득한 책들만 보고 실망을 느끼거나 실제 금융권 내용에 대한 자세한 이론부터 최근 동향까지 알고 싶은 독자들에게 강력히 추천하는 책이다.
본 책에는 은행이나 증권사, 혹은 금융 SI에서 업무를 하기 위해서는 이제는 필수로 익혀야 하는 내용들이 가득차 있습니다. 해당 분야 종사자의 필독서로 지정되어야 하는 수준이라고 생각합니다. 취업을 준비하는 입장에서도 이 책을 읽고 프로젝트를 수행하여 차별성을 확보하는 것이 중요할 것 같습니다. 본 책의 대상 독자는 은행과 증권, 금융 SI에 종사 중인 실무자와 취준생이 가장 주 독자층일 것입니다. 하지만 저처럼 자산증식을 위한 투자 방법을 찾는 사람에게도 꽤 유용한 서적이라고 생각합니다. 역자가 관련 학계와 산업계에서 종사 중인 분이라서 그런지 글을 통해 내용을 이해하기가 좋습니다.
마침 모 강의사이트에서 모모 금융데이터분석 강의를 한참 듣고 있던 중이었다. 금융이라기 보다는 정확히는 주식데이터 강의였는데, 주식 자체에 대한 정보 보다는 '데이터 분석 과정을 설명하되 데이터를 주식데이로 한다'는 측면이 더 커서 매 차수 중복되는 내용들도 많이 있었다. 그래서 혹시 이 책에서는 다른 지식과 인사이트를 주지 않을까 해서 이 책을 선택하게 되었다. 그런데 파이썬 코딩만으로 주식으로 돈을 벌 수 있다면 누가 돈을 못 벌겠으며, 진짜라면 그 비법을 왜 공개할까 싶기도 하다. 그래서 마음을 비우고 책을 펼쳤다.
옮긴이의 말을 조금 옮겨보면 "유독 금융 분야에서 머신러닝과 인공지능이 이렇다 할 뚜렷한 성과를 보이지 못하고 있는 것이 현실이다. 이는 금융 분야에 특화된 머신러닝이나 인공지능 방법론이 나오지 않았다는 점보다는, 효율적 시장 구조 등 금융 분야의 문제들이 가지고 있는 보다 근본적인 특성에 기반한다. 이 책은 금융 분야의 다양한 기반 이론과 현업 실무에 최신 머신러닝 및 인공지능 기술을 적용하는 것이 실제로 어느 정도의 가능성을 가지는지를 폭넓은 관점에서 고찰한다."고 되어 있다.
1부에서는 지도학습, 신경망, 초지능, 2부에서는 전통적이고 규범적인 금융이론, 데이터 기반 금융 등에 대한 기본적인 내용을 다루고, 3부에서는 딥러닝, 신경망, 강화학습을 적용해서 금융시장의 '통계적 비효율성'을 발견하고, 이것을 전제조건으로 4부에서 알고리즘 트레이딩을 통해 통계적 비효율성이 어떻게 활용되는지를 다루는 순서로 되어 있다. 5부에서는 금융 산업에서 인공지능이 가져올 결과와 금융적 특이점에 대해서 살펴본다. 6부에서는 파이썬 코드로 구현하는 법과 예제가 있다.
특히 '통계적 비효율성'이라는 표현이 눈에 와 닿았다. Statistical Inefficiency.
앞부분은 대충 아는 내용들이라 이 통계적 비효율성을 다루는 부분(3부)으로 가보았다. 7장에서 Dense한 신경망의 클래스의 불균형과 과적합을 막기 위한 방법, 그리고 최적화 방법을 소개한다. 과적합을 막기 위한 데이터 정규화, 드롭아웃, 규제, 배깅 과정을 코드와 함께 설명하고 있었다. 한 권의 책에서 많은 내용을 다루다 보니 간단하게 설명된 면도 없진 않다. 8장에서는 재귀 신경망 예제를 보여주는데 금융 가격 시계열, 금융 수익률 시계열 데이터에 이동 모멘텀 특징과 이동 변동성 특징이라는 '금융 특징'을 추가하는 방법을 보여준다. 9장에서는 강화학습의 기본 개념에 대해 설명하고 카트폴 문제(좌우로 움직이는 카트 위에 있는 막대기가 쓰러지지 않고 균형을 잡을 수 있도록 학습하는 문제)를 OpenAI Gym, 몬테카를로 에이전트, 신경망 에이전트, DQL 에이전트를 통해 해결하는 방법들을 코드와 함께 보여준다. 그리고 이것을 금융 분야에 초점을 맞춰 구현해 본다. 그런데 여기까지 따라왔지만 나는 '통계적 비효율성'이라는 용어가 의미하는 것이 무엇인지 정확히 찾아내지는 못했다. 아직 공부해야 하는 것이 많구나. 기초적인 용어조차도 검색을 해야하다니...
전체 코드는 https://aiif.pqp.io 에서 쉽게 실행해볼 수 있고, 상업화나 재배포는 허락을 받아야 하지만 프로그램에 포함시키거나 문서에 넣는 것은 상관이 없다고 한다. 파라미터에 대한 설명이나 앞의 코드에서 추가해 실행한 부분들에 대해서는 번호를 달아 설명을 붙여놨기 때문에 이해하기가 따라가기가 쉬웠다.
5부의 내용이 나에게 특히 도움이 되었는데, 금융에 대해서는 잘 모르는 컴공쟁이라서 타인의 관점으로 분석을 하거나 내가 미처 생각할 수 없었던 부분에 대해서 의견을 내주는 것은 언제든지 반갑다. 반대로 금융 쪽을 잘 알지만 프로그래밍을 모르는 분들에게 오히려 더 도움이 될 수 있는 책일 수도 있겠다는 생각이 들었다.
해외 선물 투자를 하는 주변 지인이 있다. 전업은 아니지만 승률이 나쁘지는 않은 것으로 알고 있다. 필자는 투자를 하지 않지만 그 지인분과 만날 때마다 투자기(?)를 전해듣는 편이다. 지인의 가장 큰 문제는 "(본인이 나름대로 정해둔) 규칙대로만 하면 따는데, 사람이라 그런지 돈을 잃는 순간 규칙대로 행동하기가 어렵다."이다. 사람인지라 실제 돈이 걸리면 편향이나 휴리스틱이 작동하게 되고 이 때문에 손실 시에 AI처럼 행동하기가 어렵다는 것이다.
이러한 사람의 편항을 극복하기 위해 수 년 전부터 인공지능 퀀트가 핫 키워드로 떠오르고 이를 주력으로 하는 스타트업도 많이 등장했다. 편향이나 휴리스틱이 없는 인공지능 퀀트가 인간보다 유리해 보이긴 하지만 아직 인공지능의 수준이 그 정도는 아닌 것 같다. 만약 그렇다면 인공지능 모델 기반의 펀드투자사가 떼돈을 벌었겠지만 그렇지 않은 걸 보면 말이다. 필자도 궁금해서 약 2년 전부터 모 인공지능 펀드를 운영하는 스타트업에 주기적으로 돈을 넣고 있지만 수익률이 엄청 높지는 않다. (물론 금액이 적기에 그럴 수도 있고, 하락장에서 원금 안까먹은거 보면 그것만으로도 대단하긴 하지만...)
아무튼 이제는 개인 투자자 단에서도 인간의 편향을 극복하기 위해서 (꼭, 딥러닝이 아닌 룰베이스 일지라도) 인공지능 모델을 구현하고 돌려보려는 사람이 많아지고 있다. 이 책은 인공지능을 투자에 도입해보려는 투자자에게 바이블로 적절한 책이라고 할 수 있다. 이전 책에서도 금융에 기술을 접목하는 주제로 집필했던 저자는 이번 책에서는 본격적으로 인공지능을 접목하고자 했다.
해당 책의 앞부분에서는 금융관련 지식을 간략하게 커버하고 있으며 관련된 인공지능 모델도 처음부터 끝까지 훑고 있다. 책에서 재밌었던 부분은 Part 4. 다. 모델링이 잘 되는 것은 차치하고서라도 어떤 모델이든 백테스팅 이후에 모델을 도입하고 배포하기 마련인데, 근래의 서적 내용은 모델링 쪽에 치우쳐있고 해당 부분은 짧게 다루는 부분이 많았다. 이번 책에서는 실전에 모델을 접목하는 것까지 다루고 있는 만큼 해당 부분이 생각보다 자세해서 마음에 들었다.
책이 넓은 부분을 다루고 있는 것은 사실이지만 결국은 알고리즘을 어떻게 짜고 어떤 데이터를 통과시키고 이를 얼마나 딜레이 없이 배포하느냐의 문제다. 즉, 책을 따라서 모델을 만든다고 돈을 벌지는 못한다. 따라서 인공지능을 통해서 투자에 입문하려고 하기 보다는, 투자에 대한 본인의 철학을 갖춘 후에 해당 책을 읽고 자신의 '그 철학'을 코드로 구현해내면 좋을 것이다.
데이터를 기반으로 금융에 접근하는 방법에 대해 상세하게 정리된 책이다. 기초적인 내용부터 응용 및 적용까지 구성되어 있다. 특히 일반적인 머신러닝과는 달리 최적화 관련 내용도 수록되어 있다. 논문을 기반으로 한 내용들이 많아서 양적으로 질적으로 읽기 좋은 책이라고 판단된다.
파이썬 기반 금융 인공지능. 이 책은 금융 분야 전문가를 위한 책이다. 혹시라도 인공지능이란 단어와 금융이란 단어에 혹해서 책을 읽을 수도 있는데(그게 바로 내 이야기) 정말 많이 어려운 책이다. 수학과 언어에 능한 사람이라면 도전해 볼 만한 책이다.
이 책이 소개 하는 내용은 기계 지능 인공지능을 알고리즘에 학습시키는 이론과 신경망 알고리즘의 기본적인 동작 원리 등을 파이썬을 활용하여 설명하고 있다. 책 머리말에 나오는 소스코드를 볼 수 있는 주소로 접속하면 간단한 회원 가입 후 책의 모든 소스 코드를 사용할 수 있다. 추가 웹에서 파이썬을 구동 하기 때문에 파이썬 설치와 코드 타이핑이 필요가 없어서 파이썬을 잘 다루지 못하는 사람들도 충분히 읽을 수 있는 좋은 책이다.
다만, 책에서 소스코드를 다운로드할 수 있다는 링크를 찾아가면, 대단히 대단히 찾기 어렵게 되어 있다. 심지어 방문자가 방명록에 홈페이지 UX 별로라고 글을 써놓기도 할 정도. 정말이지 미로 찾기도 아니고 소스코드를 볼 수 있는 링크를 찾기가 굉장히 어렵게 되어있다. 그래서 겨우겨우 찾아낸 링크를 여기에 공개한다.
https://worker28.pqp.io:8001/tree/aiif/code
이 주소로 접속하면, 아래 그림처럼
책에 있는 모든 소스코드들이 있고
위에 실행 버튼을 누르면 타이핑 없이 실행도 가능하다.
위 이미지는 소스코드 사이트에서 실행 버튼 만으로 실행한 이미지 이다 책의 내용과 동일하게 출력되는 것을 확인 할수 있다.
인공지능의 설명을 하면서 지루하지 않도록 알파고에 대한 숨겨진 이야기라든지, 인공지능을 학습시켜서 게임기 게임을 플레이 시켜서 인간보다 더 높은 스코어를 올리게 한 사례 등을 설명한다. 평소에 금융과 인공지능에 관심이 있거나 금융의 이론을 실제 시뮬레이션을 통하여 확인하고 싶은 분들에게 추천한다.
최근 인공지능, 머신러닝, 딥러닝 등 소위 “핫"한 토픽이 대두되기에 이전부터 가장 데이터를 활발하게 활용하고 있던 분야가 있다면, 그건 바로 금융 업계일 것이다. 다만 금융을 전공하지 않은 CS 기반의 데이터 직군 종사자가 금융 업종의 전문 또는 배경지식을 갖추고 데이터를 활용하는 업무를 하는 것 또한 쉽지 않은 일이다.
특히 기존에 금융 업계에서는 알고리즘에 기반한 트레이딩과 시뮬레이션이 존재해왔었는데, 이는 인공지능 기법의 발전과 더불어 앞으로 더욱 발전해나갈 여지가 무궁무진한 분야이며, 현재에도 활발한 연구가 진행되고 있다.
금융 데이터의 맛
이번에 리뷰하게 된 파이썬 기반 금융 인공지능 에서는 인공신경망, 강화학습 등의 기법들을 금융 데이터에 적용하는 방식 뿐만 아니라, 금융 이론, 금융 데이터의 개념과 특이점, 백테스팅과 같은 알고리즘 트레이딩 기법도 다루고 있어, 금융 도메인의 지식이 없는 사람이라면 꼭 참고해야할 내용들이 담겨져 있다.
특히 파트 2 “금융과 머신러닝” 에서 다룬 내용이 인상적이었는데, 금융학의 베이스를 이루는 이론과 모형에 대해 설명하고, 대량의 데이터를 수집하고 연산할 수 있는 기술의 발전과 더불어 머신러닝을 접목한 금융의 미래로 이어지는 흐름이 이 책의 알짜배기라고 생각이 된다.
- 나날이 발전하는 인공지능 기술이 등장하면서 많은 사람들이 인공지능을 공부하고 있습니다.
- 인공지능은 기존에 풀지 못한 문제를 풀 수 있는 강력한 도구로, 인공지능 자체에 대한 학습뿐만 아니라 인공지능을 사용하여 어떤 문제를 푸는가도 매우 중요합니다. 즉 도메인 지식이 생각보다 중요합니다.
- [파이썬 기반 금융 인공지능](https://www.hanbit.co.kr/store/books/look.php?p_code=B2409963430)은 인공지능을 활용한 금융 분석에 대한 책입니다.
## 금융 전문가를 위한 지침서
- 인공지능과 금융을 생각하면 보통 퀀트 트레이딩을 떠올리는 경우가 많습니다. 퀀트 모델만을 위한 다른 책이나, 인터넷 가이드도 많이 있습니다. 하지만 인공지능과 금융에 대한 기초적인 바탕을 채워나가는 책은 드뭅니다. 이것이 이 책이 가지는 가장 큰 강점이라 생각합니다.
- 금융 데이터에 대한 기본적인 이해를 시작으로 분석과 가공, 다양한 전략을 세우고 이를 효율적으로 활용하는 방법까지 포괄적인 내용을 쉽게 다루고 있습니다.
## 실습 위주의 진행
- 책의 초반부는 인공지능에 대한 간단한 소개와 설명이 있고, [PART II 금융과 머신러닝]부터 금융에 대한 이야기가 시작합니다. 하지만 상당히 많은 양이 파이썬 코드로 이루어져 있고, 책에서 소개한 개념과 코드를 따라가며 천천히 이해할 수 있도록 도와줍니다.
## 연계된 책
- 저자인 [이브 힐피시]가 쓴 [파이썬을 활용한 금융 분석 (2판)](https://www.hanbit.co.kr/store/books/look.php?p_code=B2027701371) 또한 금융을 바라보는 (이 책과는) 조금 다른 입장에서 설명하고 있어, 금융 도메인의 전문가가 되고 싶다면 같이 읽어보는 것을 추천합니다.
인공지능(AI : Artificial Intelligence)은 2010년경에 중요 기술로 대두되었고 2020년경에 이르러서는 지배적인 기술로 인정받기 시작했다. 기술과 알고리즘의 혁신, 빅데이터의 사용, 그리고 지속적으로 증가하는 컴퓨팅 파워에 힘입어 여러 산업 분야에 인공지능에 의한 근본적인 변화가 진행되고 있다.
본 서 "파이썬 기반 금융 인공지능"은 금융에서 인공지능과 관련된 다양한 측면을 다룬다. 금융 인공지능(AFI : Artificial Financial Intelligence), 신경망(Neural Network) 기반의 통계적 비효율성(Statistical Inefficiency) 발견, 알고리즘 트레이딩 등 인공지능 기반의 금융 관련된 대략적인 로드맵을 확인 할 수 있다.
본 서를 읽으면서 추천해주고 싶은 대상은 다음과 같다.
- 인공지능 연구자 및 개발자
=> 다양한 분야에 접목한 인공지능 연구결과물을 접하면서 다양한 뷰를 가질 수 있을 것이라 판단됨
- 금융공학 연구자 및 종사자
=> 금융공학 연구라함은 과거와 현재의 데이터를 기반하여 현재 상황 및 미래를 예측하는 메소드를 연구하는 분야이기에 연구에 다양한 뷰를 가질 수 있을 것이라 판단됨
아울러, 본 서 "파이썬 기반 금융 인공지능"에서 소개된 알고리즘 트레이딩 전략과 방법론을 구현하고 싶은 독자는 "파이썬을 이용한 알고리즘 트레이딩 (제이펍, 2021)"이 좀 더 프로세스 지향적이고 기술적으로 자세한 내용을 가진 참고 문헌이 될 수 있으며, 파이썬 기반 금융 분야의 맛을 보고 싶은 독자는 "파이썬을 활용한 금융 분석(한빛미디어, 2022)를 추천한다.
2. 파이썬 기반 금융 인공지능
본 서 "파이썬 기반 금융 인공지능"은 인공지능을 사용하여 금융 시계열을 예측하는 응용 분야에 초점을 맞추고 있다. 본 서의 목표는 미래의 시장 움직임을 예측해서 인공지능 알고리즘 단순 전략을 능가할 수 있는 통계적 비효율성을 발견하는 것이다. 통계적 비효율성은 경제적 비효율성의 기반이 되며, 경제적 비효율성을 이용하려면 시장을 뛰어넘는 수익을 실현 가능하도록 통계적 비효율성을 이용할 수 있는 매매 전략이 필요하다. 즉, 예측 알고리즘과 집행 알고리즘으로 구성되어 알파를 창출하려는 전략있어야 한다는 것이다.
- 금융 인공지능의 분야
그 외에도 금융 인공지능에는 다양한 분야가 있다. 그 리스트와 간단한 설명은 다음과 같다.
신용평가
인공지능 알고리즘을 사용하여 잠재적 채무자의 신용을 평가하고 의사결정을 내리는 과정을 자동화할 수 있다.
부정 적출 (이상탐지)
인공지능 알고리즘은 일상적이 패턴과 상이한 패턴을 발견하고 이러한 일이 발생하지 않도록 부정 사용을 검출하는 데 사용될 수 있다.
집행 매매
인공지능 알고리즘은 대규모 블럭 매매를 어떻게 최선으로 집행하는지 즉, 어떻게 시장 충격과 거래비용을 감소시키는지도 학습할 수 있다.
파생 상품 헤지(Hedge)
인공지능 알고리즘으로 단일 파생 상품 혹은 파생 상품 포트폴리오의 Hedge 매매를 최적으로 하는 것을 훈련시킬 수 있다. 이러한 접근법을 딥 헤지(Deep Hedge)라고 한다.
포트폴리오 관리
퇴직연금과 같은 장기 투자의 관점에서 금융상품 포트폴리오를 구성하고 리벨런싱하는 데 인공지능 알고리즘을 사용할 수 있다.
고객 서비스
고객 문의를 처리하는 자연어 처리에도 인공지능 알고리즘이 사용된다. 다른 산업 분야와 마찬가지로 금융에서도 챗봇은 인기가 많다.
위에서 제시된 금융 인공지능의 연구 성과는 2019년 이후에도 꾸준히 산출되고 있으며, 많은 연구자들의 관심사이기도 하다.
- 금융 인공지능의 위험
현재 금융 인공지능의 위험과 규제에 대한 논의가 활발하게 진행되고 있다. 그 종류는 5가지로 다음과 같다.
프라이버시
금융 분야는 엄격한 프라이버시 관련 법률을 가진 민감한 분야이다. 그에 따라, 그 데이터도 민감하다. 대규모 인공지능을 학습시키려면 개인정보가 어느 정도 필요하다. 이렇게 되면 부적절한 방법으로 개인정보가 누출되거나 사용될 수 있는 위험이 증가된다. 하지만, 본 서에서 실험을 진행한 대상 데이터인 금융 시계열과 같이 공개된 데이터를 사용할 때는 이러한 위험이 발생되지 않는다.
편향
인공지능 알고리즘은 일반 혹은 법인 고객에 관련된 데이터에 내재되어 있는 편향을 쉽게 학습할 수 있다. 알고리즘은 데이터가 허락하는 한도 내(도메인)에서만 예측이 가능하다.
설명불가능(Black Box)
딥러닝은 기본적으로 Black Box이기 때문에 어떠한 모델을 기반으로 금융상품에 대해 알고리즘 트레이딩을 수행할 때, 논리적인 설명이 불가능하다. 설명 가능한 인공지능(XAI)에 대한 연구가 활발하게 진행되었지만 아직은 미미한 수준이다.
집단행동
과거의 역사적인 폭락 이슈들을 보면 금융 매매에서의 집단행동이 어떠한 리스크를 가졌는지가 도드라진다. 인공지능의 무조건적인 활용은 집단행동으로 인해 이유없는 과매도와 과매수가 발생 할 수 있다.
알파의 감소
금융에서 인공지능이 더 널리 사용될수록 시장에서 알파가 사라질 수 있다. 경쟁 우위를 보호하려면 더 좋은 기술을 확보해야 하고 더 많은 대체 데이터를 사용해야한다.
3. 결론
본 서 '파이썬 기반 금융 인공지능'은 경제학 이론과 트레이딩 그리고 인공지능 기술이 융합된 금융 인공지능을 포커스로 하여 작성된 책이다. 개인적으로 미시경제학과 거시경제학에 대해서 공부를 조금 해보았는데, 무차별곡선, 효용 등 관련 용어에 대해서는 어느 정도 이해함과 동시에 구현 원리에 대해서는 정말 소소하게 이해한 것 같다. 그와 동시에 금융공학을 전공하는 이에게는 큰 도움이 되는 책이 될 것 이라는 생각이 들었다. 몇몇의 경제/트레이딩 전문용어를 이해하기는 힘들었지만 본 서의 전체 맥락을 이해하는 수준이 된다면, 금융 인공지능 전문가는 아니더라도 입문자/중급자 정도는 되지 않을까? 라는 생각이 들었다. 아울러, 금융 인공지능의 분야와 위험에 대해 알아가는 시간을 가졌다. 개인적으로 궁금했지만, 어떤 방식으로 지식에 접근할지 몰랐었는데 본 서를 통해 간접적이라도 알게 되어 좋은 시간을 가졌다고 생각이 든다.
이 책은 금융전문가인 이브힐피시라는 저자와 데이터 사이언스 스쿨 사이트를 운영하는 김도형 박사님에 의해 번역이 되었다. 올해 초에도 이 두분의 저자, 역자 분의 책인 “파이썬을 활용한 금융 분석 2판”을 통해서도 많은 도움을 받았다.
어떤 사람이 읽으면 좋을까?
이 책은 이전에 리뷰했던 “파이썬을 활용한 금융 분석 2판” 처럼 파이썬, 머신러닝, 딥러닝, 금융이라는 키워드를 통해 실제 금융데이터에 적용해볼 수 있는 다양한 기법을 튜토리얼 형식으로 제공하고 있다. 그래서 파이썬 데이터사이언스 스킬 뿐만 아니라 금융 지식도 함께 얻을 수 있는 책이기도 하다. 아마 이 책을 읽는 독자는 개발이나 데이터 전문가로 파이썬을 활용하여 금융 데이터를 통해 예측 모델을 만들어 보려는 사람도 있을 수 있고 금융전문가로 파이썬을 배워 업무에 활용해 보고자 하는 사람도 있을 것이다. 어느 측면에서 시작했건 특정 전문 도메인에 실제 예측모델을 적용해 보고 배포하는 과정까지를 포함하고 있기 때문에 모델을 만들어서 실제 투자에 활용하고자 할 때 도움을 받을 수 있는 책이다.
이 책에 관심을 갖게 된 계기
실제로 한 때 투자 예측 모델을 만들어 직접 투자에 적용해 볼 만큼 이 분야에 관심이 많았다. 직접 예측 모델을 만들었을 때는 나름대로의 기준을 갖고 볼린저밴드, MACD, RSI 지수 등을 산출하고 재무제표 데이터를 피처로 활용하여 투자 모델을 만들었었는데 모델이 예측하는 것은 대부분 급등주여서 비싼 수업료를 지불하고 투자를 그만두었던 경험이 있기도 하다. 또, 머신러닝, 딥러닝을 활용하여 업무적인 측면 뿐만 아니라 생활 경제와 밀접하게 관련있는 데이터에 적용해 보면 비싼 수업료를 지불하더라도 배우는 게 컸다. 금융적인 지식 뿐만 아니라 머신러닝이나 딥러닝 모델을 어떻게 하면 개선해 볼 것인지 고민할 때 이 책의 사례를 참고해 보고 싶었다.
책에서 다루는 인공지능 기술
금융 전문가를 위해 다루는 AI책인 만큼 통계적 비효율성에 AI를 더해 알고리즘 트레이딩에서 경제적 비효율성을 역이용 하는 방법을 소개하고 있다. 또, 케라스 코드를 통해 설명하고 있는데 텐서플로 2버전부터 케라스를 공식 API로 채택하고 있기 때문에 이 책을 통해 적절하게 추상화된 케라스 알고리즘을 통해 금융데이터에 집중할 수 있도록 해준다.
다양한 데이터
정형 데이터 뿐만 아니라 금융데이터를 다루다 보면 뉴스, 종목게시판 등의 내용을 보게 되는데 이런 비정형 데이터를 다루는 방법도 소개하고 있다.
딥러닝과 강화학습
딥러닝을 활용한 지도학습 방식 뿐만 아니라 강화학습과 관련된 내용까지 소개하고 있다.
쉽지 않은 난이도
전문적인 파이썬 지식과 금융지식을 다루기 때문에 내용이 쉽지는 않다. 또 아주 기본적인 파이썬 문법, 딥러닝의 학습과정과 이론적인 내용을 어느정도 알고 있지 않으면 쉽게 읽히지 않을 내용이다. 하지만 이 책 한권을 통해 마치 전문 퀀트처럼 흉내를 낼 수 있고 무엇을 더 배워나가야 할지 고민하게 해주는 책이다.
이전에 출판된 동일 저자와 역자의 책인 “파이썬을 활용한 금융 분석 2판” 과 함께 읽으면서 어려운 금융용어나 분석 내용을 이해하는데 좀 더 도움이 되었다.
> 이 리뷰는 한빛미디어 __나는 리뷰어다__ 활동을 위해서 책을 제공받아 작성된 서평입니다.
AI 가 유행하고 많은 분야에서 사용되면서 금융 분야에도 점차적으로 적용되기 시작되는 것 같다. 이제는 AI 가 적용되지 않은 분야를 찾기 어려울 것 같은데 이 책은 그중에서 금융에 인공지능을 어떻게 적용해 나가는지 알려주는 책이다.
사실 금융이라는게 개념도 어렵고 많은 어려운 내용들이 포함되어 있어서 접근하기 어려운 분야인데 이 책에서는 필요한 개념들 위주로만 설명해주고 실습 위주로 진행해 나가므로 거부감은 별로 들지 않았던 것 같다. 또한 인공지능에 대한 간단한 실습들을 진행하면서 이렇게 적용할 수도 있구나 하는 생각도 들었다.
책은 초반에 거의 모든 인공지능 서적이 그렇듯 인공지능의 탄생에 대해서 알려주고 분석을 진행할때 필요한 몇가지 개념들을 짚고 넣어간다. 만약 이미 다른 많은 서적을 읽었던 분이라면 이 부분은 건너뛰어도 될 것 같다. 그 이후에 3장에서는 간단한 금융지식에 대해서 짧게 설명한다. 그 후에는 이제 이 분야를 인공지능으로 어떻게 넘어가는지 데이터를 통해 분석하고 인공지능을 적용해 나가는 모습을 그려준다.
이 이후부터가 이 책의 핵심적인 내용인데 신경망과 강화학습을 금융 분야에 적용해서 실습하는 과정을 거친다. 여기서 알고리즘(DNN, RNN) 등에 관한 지식을 다루는 내용이 아니라서 이러한 내용은 없고 실제로 실습 위주로 진행한다는 점을 기억하면 좋을 듯 싶다. 그 후에는 3부에서 실습한 내용들을 바탕으로 매매전략을 세우는 알고리즘 트레이딩 전략을 세우는 방법을 설명한다. 실제로 금융분야에 종사한다면 이 부분이 가장 흥미롭게 바라볼 수 있을 것만 같다.
요즘 직장인이라면 대부분이 주식 혹은 코인을 하면서 트레이딩을 하는데 한번쯤은 트레이딩 봇을 만들고 싶다는 생각을 해봤을 것 같다. 작성자도 그런 궁금증에 이 책을 신청해서 한번 읽어봤는데 역시 어려운 두 분야를 섞어놔서 그런지 조금 이해가 잘 안되는 부분이 많았던 것 같다. 하지만 AI 를 이미 하시고 있거나 금융쪽에 종사하는 분들이라며 더 흥미롭게 쉽게 읽어나갈 수 있지 않을까 싶다. 요즘 트랜드에 맞는 책이라는 생각이 들어 한번쯤 읽어보는 것은 추천한다.
지난 번 책에서는 금융 분석을 하고 인공지능 얘기는 뒷부분에서 짤막하게 다루어졌다면, 이번에는 인공지능이 주된 내용이다. 사실 금융 인공지능을 만든다고 해도 금융에서 주로 사용되는 개념들은 알고 잇어야 하는데, 이번 책에서는 그런 내용은 조금 적었던 것 같다.
책의 앞뒤는 위와 같이 생겼다.
오레일리의 책에는 항상 어떤 동물이 그려져 있는데,
이번에는 둑방쥐라고 한다.
이 책은 엄청나게 긴데 (>400페이지) 그만큼 목차도 굉장히 길고 다양한 내용이 있다.
목차만 해도 정말 많은데, 그 중에 큰 주제만 가져와봤다.
처음에는 인공지능이 무엇인지에 대한 설명부터, 금융 인공지능을 만들기 위해 필요한 금융 쪽 개념들과 실전 인공지능 구현을 한 후, 테스트해보는 큰 흐름을 가지고 있다. 이론적인 내용 말고도 마지막에는 이 인공지능을 활용한 투자에 대한 전망과, 좀 더 자세한 인공지능에 대한 설명이 있다.
특히 전망 분야가 조금 재미있어보였다.
만약 기계가 모든 투자를 하게 된다면 결국 사람이 투자를 하던 시대와 비슷하게 기계들끼리의 경쟁이 일어날 것이라는 내용이다. 그렇게 될 경우 어떻게 하면 좋은, 똑똑한 인공지능을 만들 수 있을지와 그러한 사회가 될 때 어떤 사회적인 규범이 새롭게 생겨나고 고민되어야 하는지를 설명한다.
최근 인공 지능이 발전함에 따라 정말 많은 분야에서 사용되고 있는데, 돈과 직접적으로 닿아있는 퀀트 투자는 정말 매력적인 것 같다. 나도 몇 번 시도해보고 잘 안 되긴 했었는데, 만약 퀀트 투자, 그 중에서도 인공 지능을 활용하고 싶다면 읽어보면 좋을 것 같다.
사람도 모든 분야에서 다 똑똑한 사람은 드물고, 특정 분야에서의 지식을 획득하고 쌓아 나가면서 전문가가 되는 것 처럼, 인공지능도 마찬가지로 특정 도메인에 맞춰서, 특화되는 흐름을 갖고 있습니다.
이것은 그냥 데이터 타입의 문제뿐만 아니라, 해당 도메인의 특성에 대한 도메인 특성을 알고 있어야, 데이터의 의미를 좀더 제대로 이해할 수 있는 것과 마찬가지입니다.
그동안의 알려진 인공지능 책들은 대부분, 도메인에 상관 없이, 1) 인공지능 자체의 기술 혹은 2) 특정 데이터 형식에 맞는 인공지능 활용 기술에 대한 내용들이 대부분이었습니다.
1)의 경우라면, 딥러닝의 기본 개념과 기본 모델에 대한 설명을 하는 책이었고,
2)의 경우라면, 시리얼 신호 데이터, 이미지데이터, 자연어 데이터 등에 대한 처리 방법에 대한 책들이 그렇죠.
이 책은, "금융도메인"이라는 도메인 자체에 초점을 맞춘 책입니다.
즉, 인공지능이 어떻게 동작하는 것인지를 얘기하기 보다는 (간단한 설명은 하고 넘어가고 있습니다만, 이 책으로 해당 라이브러리를 사용하는 것의 실제 의미 (함수의 의미와 각 파라메터의 의미, 그리고 파라메터의 변화가 최종적으로 모델을 어떻게 변화시키는지에 대한 것들을 알 수는 없죠)를 이해할 수는 없고, 그냥 <그런것이 있다> 수준에서의 설명으로 넘어갑니다), 금융 도메인에서 인공지능을 통해 무엇을 할 수 있고, 그것을 위해, 어떤 기법을 사용해야 하는지에 대한 이야기를 하고 있습니다.
금융 도메인에서 가격 결정을 위한 이론들에 대한 설명,
금융 도메인에서 획득 가능한 데이터의 종류와 각 데이터 타입에 따른 실제 의미, 그리고, 그 데이터가 앞에서 언급한 이론들과 어떻게 연결되는지에 대한 설명,
인공지능을 적용할 수 있는 금융 도메인 안에서의 특정 이슈들에 대한 설명
실제 샘플 도메인에서 딥러닝을 이용해 문제를 해결해보는 따라하기식 예제 제시
그리고 마지막으로
금융 분야 자동화의 핵심인 트레이딩 시스템 구현 예제를 보여줍니다.
특정 도메인에서 실제로 인공지능 기술이 어떻게 활용될 수 있는지에 대한 설명과 예제가 담겨져 있는 책이었습니다.
공돌이가 금융 도메인에 대해 공부하기 위한 책으로 활용해도 괜찮고, 반대로, 금융학도가 인공지능을 적용해 보려고 할 때도 도움이 될 수 있는 책이었습니다. (인공지능에 대한 세세한 설명은 없지만, 그래도 따라하는 것에는 문제가 없을 정도로 친절한 따라하기 설명이 제공되니까요)
확실히 본 도메인(금융 도메인에서의 인공지능)에 관심이 있는 사람이라면, 읽을 가치가 충분한 책이었습니다.
이 책은 금융권에서 AI를 활용하는 금융 전문가를 위한 인공지능 활용 실전 지침서다. 책의 초반부에서는 지도 학습, 초지능 등 일반적으로 활용되는 AI의 핵심 개념을 소개한다. 그다음 AI를 이용해 금융 시장에서 통계적 비효율성을 찾아내는 방법으로 내용을 확장한다. 그리고 어디에서도 배울 수 없는 통계적 비효율성에 AI 알고리즘을 더해 알고리즘 트레이딩에서 경제적 비효율성을 역이용하는 방법을 설명한다. 마지막으로 신경망 훈련을 위한 파이썬 코드 예제와 금융 시계열 예측을 소개하며 이 책을 마무리한다. 이 책을 따라 모든 학습을 마치고 나면 AI를 활용해 기존의 금융 시스템에 디지털 혁신을 가져올 금융 전문가로 거듭나 있는 자신을 발견하게 될 것이다.
[주요 내용]
- AI와 초지능에서 활용되는 AI의 핵심 개념과 알고리즘
- 데이터 기반 금융, AI, 머신러닝이 금융 이론과 실무에 영향을 미치는 이유
- 신경망과 강화 학습을 금융 시장의 통계적 비효율성에 적용
- 백테스팅과 알고리즘 트레이딩을 통해 경제적 비효율성 활용
[대상 독자]
- 금융 분석 전문가
- 데이터 엔지니어
- 데이터 과학자 및 금융AI 개발자
[서평]
회귀분석과 분류 모형부터 강화 학습, 금융 특이점까지!
금융 산업의 패러다임을 바꿀 AI를 적용한 금융 분석 실전 가이드
오늘날 인공지능과 머신러닝은 금융 데이터의 프로그래밍적 가용성과 결합되면서 금융 산업의 패러다임을 바꾸고 있다. 이러한 흐름에 따라 인공지능과 머신러닝을 금융 분야에 적용하려는 책들이 많이 출간되었다. 하지만 이 분야의 연구가 아직 초기 단계이다보니 적절한 이론적 기반이나 경험적 증거가 부족한 경우가 허다하다.
이 책은 그간의 책들과는 다르게, 인공지능 기반 알고리즘 트레이딩 전략을 개발부터 백테스팅, 배포까지의 모든 내용을 제공한다. 책에서 소개하는 방법론과 예제 대부분은 수십 년간 저자가 쌓아온 연구에 기반한 것이다. 단순히 기술적 매매나 투자 방법론에 머신러닝과 인공지능을 적용하여 투자 수익률을 높이는 방법에만 집중하지 않는다. 파이썬을 활용해 금융 분야의 핵심 이론이 어떻게 형성되어 왔으며, 머신러닝과 인공지능을 활용하여 이론이 지닌 부족함을 어떻게 보완할 수 있는지 설명한다. 또한 인공지능과 머신러닝을 활용해 금융시장의 통계적 비효율성을 발견하고 알고리즘 트레이딩을 활용하는 방법에 대해 배울 수 있다. 머신러닝과 딥러닝 알고리즘을 금융에 적용하려고 시도하는 모든 이에게 훌륭한 안내서가 되어줄 것이다.
AI와 Python을 기존에 접해보셨다면, 금융 공학에 대한 다양한 접근 방식을 실습할 수 있음
금융이나 경제 관련 내용은 YouTube 등을 통해서 보완하면서 진행하길 권함
금융에 대한 경험이나 지식을 가지고 있다면, AI와 Python과 관련된 보조 교재를 활용하길 권함
초급자를 위한 Tensorflow 등과 같은 교재를 활용해서 함께 실습하길 권함
금용/Python 두 가지를 처음 접하는 분들은 각 장의 핵심 주제를 중심으로 실습을 권함
처음이라면 실습을 통해서 출력되는 결과를 가지고 금융과 관련된 아이디어를 중심으로 진행하길 권함
금융 공학의 세부적인 주제를 소개
금융 공학을 다루는 많은 책들은 데이터를 다루는 방법으로 ‘시계열(time series)’을 채택한다. Python을 기반으로 소개된 금융 공학 책들이 Pandas와 Scikit-learn을 활용하는 것을 주로 다루고 있다. 이 책은 Keras를 기반으로 금융 공학과 AI를 접목해서 다르고 있다.
Python과 Keras를 활용해서 ‘시계열’ 데이터를 활용하는 방법 뿐만 아니라 알고리즘 트레이딩까지 다루고 있다. 그래서 각 장(chapter)의 내용이 생각보다 깊다. 이 책을 접하시는 분들은 금융과 인공지능에 중 하나 정도에 대한 적당한 이해도가 있으면 흥미롭게 읽을 수 있다.
실습 과정과 결과를 통해서 이해
금융 공학이 가진 어려움 중 하나가 ‘단어’와 ‘과정’이 생소하다는 점이다. 구매/판매하는 행위 뿐만 아니라 정교한 상황을 설명하기 위해서 고유한 단어와 다양한 상황을 만들어낸 과정을 설명하는 주제어가 있다. 이런 단어나 주제어는 금융에 대한 이해도가 없으면 쉽게 이해되지 않는다. 실습 과정을 통해서 각 장(chapter)에서 소개하는 핵심적인 아이디어를 접해볼 수 있다. 그리고 데이터를 표현하는 기법이나, 자주 활용되는 그래프를 작성하면서 단어의 의미를 이해하는데 도움이 된다.
책의 흐름이 지도 학습에서 시작해서 강화 학습으로 이어진다. 책의 분량에 비해서 다루는 내용이 다양하기 때문에 인공지능 관련해서 별도의 교재를 활용하길 권한다. 금융과 인공지능 두 가지 주제에 대해서 처음 접하는 분들은 책 자체가 가볍게 읽기에는 난이도가 있다. 그래서 실습을 병행해서 책의 아이디어 이해하는 방향으로 진행하면 좋은 결과를 얻을 수 있다. 쉽지 않지만 그렇다고 불가능해 보이지도 않는다.
알고리즘 트레이딩!
이 책을 읽으면서, 다양한 시장 가설을 데이터를 활용해서 검증하는 실습을 진행하였다. 그 중에서 10장에서 백테스팅을 접하게 되었는데, 개인적으로 굉장히 흥미로운 주제였다. 막연하게 생각했던 것에 비해서 재미있는 것을 실현해볼 수 있을 것 같아서, 내년에 금융 공학 관련한 것으로 주변분들고 스터디를 만들어볼까 고민했다. 혹시나 금융과 인공지능을 활용하는 방법이 궁금하시다면 시간을 내서 한번쯤 도전해보길 권한다.
파이썬 기반 금융 인공지능. 파이썬과 케라스를 활용한 금융 시계열 데이터 기반 알고리즘 트레이딩 전략이란 표지의 부제에서 알 수 있듯이 이 책은 금융 분야에 머신러닝 및 인공지능 기술 적용에 대한 내용을 담고 있다. 따라서 금융과 인공지능에 대해 관심이 있으면 책을 읽을 준비는 끝이다.
전반적인 난이도
기계지능, 금융과 머신러닝, 통계적 비효율성, 알고리즘 트레이딩, 전망으로 이어지는 파트들에서 보이듯이 지도 학습, 비지도 학습, 강화 학습, 파이썬 등 인공지능 코딩에 대한 기본 소양은 갖고 있어야 읽기 편할 것이다. 거기에 금융, 수학까지 포함되니 중급 정도의 난이도라고 본다. 설렁설렁 읽을만한 책은 아니지만 나름 다시 읽는 재미가 있다. 본인이 이상한(?) 수학기호에 많이 취약하다면 책 읽는 것을 고려해 볼 필요가 있다.
흥미로운 금융의 세계
효율적 시장 가설(efficient market hypothesis, EMH)란게 있다. 랜덤워크 가설이라고도 불리는데 어느 특정시점의 금융상품 가격은 이 시점의 모든 정보를 반영하고 있다는 것이다. 해당 시점의 주가는 항상 타당한 수준이라는 거다. 흠... 이런 효율적 시장 가설에는 3가지가 있는데
약형(weak form) 효율적 시장 가설
준강형(semi strong form) 효율적 시장 가설
강형(strong form) 효율적 시장 가설 이다.
이런 배경지식으로 효율적 시장 가설을 검증하는 코드를 구현 할 수 있다. 파이썬으로 금융 시계열 가격 데이터를 회귀 분석의 특징 데이터로 사용하여 회귀분석을 통해 예측을 해보는거지. 이런 과정은 파이썬 코드의 구현을 보고 이를 시각화환 시계열 데이터 그래프를 보고 이해를 하게 된다.
마치며
밥 아저씨 같은 책이네. 인공지능과 금융에 대한 다양한 알고리즘과 파이썬 예제들, 주식 이동평균선 신호를 이끌어내는 간단한 접근법, 시각화 방법들 등등등등 많은 정보들을 설명하는데 너무 쉽게 얘기해서 도리어 무식한(?) 내가 못 따라가는 형편이다. 밥 아저씨의 참 쉽죠~ 랄까? 트레이딩 전략과 알고리즘의 이해는 쉽지 않다. 그럼에도 도전할 만한 가치가 있지 않을까 싶다. 그래도 모르는 분야를 배운다는 것은 항상 설레는 일이다~
사실 '인공지능 퀀트 투자'라는 단어는 전혀 어색하지 않을 정도로 널리 퍼진 개념이다. 하지만 금융 인공지능이 어떤 원리로 동작하는지 자세히 알고 있는 사람은 많지 않다.
금융을 잘 아는 사람은 인공지능을 잘 모를 확률이 크고, 인공지능을 연구하는 학자들은 금융 지식이 약할 확률이 크다. 나도 한때 주식 인공지능을 만들어보겠다고 키움 API 따다가 모델에 붙여서 돌려보고 했었는데, 주식 공부하기 싫어서 때려치웠던 기억이 난다.
그만큼 서로 다른 도메인을 결합하는 것은 쉬운 일이 아니다. 하지만, 최근에는 이러한 크로스 도메인이 참 핫하다고 느껴진다. 이제는 기업들은 물론이고, 대학원 연구실들만 봐도 머신러닝 딥러닝을 안 쓰는 곳을 찾기가 어려우며, 많은 세계 석학들도 근 시일 내에 우리 일상에 인공지능이 자연스럽게 녹아들 것이라 예견하고 있다.
그렇다면 인공지능을 공부하는 우리들은 무엇을 해야 할까. 많은 사람들이, 컴공은 다른 공부 할 시간에 기술을 극한으로 가져가는 것이 맞다고들 이야기한다. 타 전공이 4년 넘는 시간 동안 쌓아 올리는 도메인 지식을 본인 공부도 하면서 따라갈 수는 없기 때문이다. 이 말에는 물론 동의한다. 하지만 그렇다고 해서 다른 도메인에 대한 관심을 끊어서는 안된다고 생각한다. 결국, 가치를 창출하는 것은 크로스 도메인이기 때문이다. (물론 본인이 인공지능 학계의 새로운 패러다임을 만들 정도의 천재라면 상관은 없다)
이 책은 금융 전문가를 위한 인공지능 활용서인 동시에, 금융 문제를 해결하고자 하는 머신러닝 실무자들에게 훌륭한 안내서이기도 하다. 금융계의 통계적 및 경제적 비효율성의 개념을 맛보고, 통계가 근본인 머신러닝과 어떻게 결합할 수 있을지를 고민하다 보면, AI 연구자들이 흔히 빠지곤 하는, 데이터 및 기술 만능주의에서 벗어난 시각을 가질 수 있을 것이다.
실무서인 만큼 리스크 관리와 주문 집행은 물론, 다양한 오픈 API 활용 및 트레이딩 봇 배포까지 다루고 있어, 이 책에서 제시하는 친절한 가이드를 따라가다 보면 어느새 개발도 잘하고 금융도 잘하는 AI 엔지니어가 될 수 있으리라 생각된다. (만약 토스나 카카오뱅크를 준비한다면, 적극 추천한다)