[시리즈] 강화학습 톺아보기
🎮

[시리즈] 강화학습 톺아보기

Category
강화학습
Tags
Reinforcement Learning
Published
January 28, 2021
Author
Jay
방학이 어느새 1달여가 다 되어가는 시점이다.. 😥
1달간의 잉여생활을 청산하기 위해, 서점에 들러 강화학습 도서를 집었다. 원래는 CS234를 도전해보려 했으나, 미약한 영어실력 및 충전된 잉여력으로 인해 1강을 채 못 끝내었다는 불편한 진실..을 뒤로 하고, 코드와 함께 있는 이 도서를 정독해보기로 마음먹었다. 아무래도 나는 코드가 없으면 재미를 못느끼는 타입인가 보다. 암튼. 이 책 만큼은 끝까지 도달하기를 진심진심으로 바란다. (교보문고에서 무려 2만 8천원을 고대로 내고 사왔다!)
 

📖 Content


  1. 강화학습 개요
  1. MDP(Markov Decision Process)
  1. 가치함수와 벨만방정식
  1. 그리드월드와 다이내믹 프로그래밍
  1. 정책 이터레이션, 가치 이터레이션
  1. 강화학습과 정책평가
  1. 강화학습 알고리즘
 

📁 Posts