풀잎스쿨

연구를 위한 지식을 플립러닝 방식으로
2-3개월 간 학습하는 집중 스터디 과정입니다.

* 풀잎스쿨은 3개월마다 진행됩니다.

매력적인 Model-based RL, 강화학습의 다양한 분야를 함께 다뤄봐요!

Model-based RL의 기초 논문부터 최근의 논문까지 리뷰하며 지식을 쌓고, 직접 구현하여 활용하는 것을 목표로 진행됩니다.
복합적인 아키텍쳐를 가진 Model-based RL 알고리즘을 구현하며, 프로그래밍 실력과 딥러닝 구현 능력을 향상 시킬 수 있습니다.
* 운영 방법 : 총 12주에서 6편의 논문을 2주씩 잡고, 1주는 발표자 선정해서 논문 리뷰
1주 동안 구현 후 코드 리뷰 및 토론

사회적 거리두기 2단계 이상일 경우, ZOOM을 활용하여 온라인으로 진행될 수 있습니다.

이런 분들께 추천합니다

- 평소 강화학습에 관심이 많으신 수강생.
- 강화학습 배경지식을 가지고 있고, model-based RL에 관심있는 수강생.
- pytorch, tensorflow 등 딥러닝 프레임 워크를 통해 알고리즘 구현이 가능하신 분.
- 영어로 된 논문을 읽고 리뷰 할 수 있는 분.

난이도

학습유형

사전학습 (주차별 학습내용을 각자 학습한 후 모여서 토론합니다)

커리큘럼

Chapter1. Dyna-Q paper review

1주차: Dyna-Q paper review
2주차: Dyna-Q 구현. (python)
[논문] Integrated Modeling and Control Based on Reinforcement Learning and Dynamic Programming - Richard Sutton
[링크] https://papers.nips.cc/paper/1990/file/d9fc5b73a8d78fad3d6dffe419384e70-Paper.pdf

Chapter2. World model paper review

3주차: World model paper review
4주차: World model 구현
[논문] World Models - David Ha, Jürgen Schmidhuber
[링크] https://arxiv.org/pdf/1803.10122.pdf, https://worldmodels.github.io/

Chapter3. I2A paper review

5주차: I2A paper review
6주차: I2A 구현
[논문] Imagination-Augmented Agents for Deep Reinforcement Learning - T Weber (DeepMind)
[링크] https://arxiv.org/pdf/1707.06203.pdf

Chapter4. SimPLe paper review

7주차: SimPLe paper review
8주차: SimPLe 구현
[논문] MODEL BASED REINFORCEMENT LEARNING FOR ATARI - L Kaiser
[링크] https://arxiv.org/pdf/1903.00374.pdf

Chapter5. PlaNet paper review

9주차: PlaNet paper review
10주차: PlaNet 구현
[논문] Learning Latent Dynamics for Planning from Pixels - D Hafner(google)
[링크] https://ai.googleblog.com/2019/02/introducing-planet-deep-planning.html, https://arxiv.org/pdf/1811.04551.pdf

Chapter6. Dreamer paper review

11주차: Dreamer paper review.
12주차: Dreamer 구현.
[논문] Dream to Control: Learning Behaviors by Latent Imagination - D Hafner(google)
[링크] https://ai.googleblog.com/2020/03/introducing-dreamer-scalable.html, https://arxiv.org/abs/1912.01603

* 이론+실습으로 진행되는 과정입니다. 참고해주세요.

교재 및 학습자료 / 준비물

1. dyna-q
2. dyna-q 구현
3. world-model
4. world-model 구현
5. i2a
6. i2a 구현
7. simple
8. simple 구현
9. planet
10. planet 구현
11. dreamer
12. dreamer 구현

풀잎스쿨이란

풀잎스쿨 신청자분들께는 과정 시작 일주일 전에 참여 관련 안내 메일을 드릴 예정입니다.

퍼실이 소개

이정우

#인공지능 #RL

강화학습에 많은 관심을 가지고 있는 이정우입니다. 여러 강화학습 스터디에 참여하고 공부하면서, model-free RL 알고리즘들만 주로 다뤄지는 것을 느꼈습니다. 다른 관점에서 model-based RL의 지식을 쌓고 구현 능력을 향상시키기 위해 개설하게 되었습니다.

풀잎스쿨 / LAB 참여 이력

DeepMind 따라가기 - 퍼실이
멀티테스크 & 메타러닝 part 1, 2 참여

환불정책

첫 모임 시작 전날까지 취소 및 전액 환불이 가능합니다.
환불 신청은 홈페이지 상단의 “문의글 작성” 에서 가능합니다.

Model-based RL 논문 리뷰 및 구현

시작일

2021년 1월 9일

진행일시

토 / 13:30

수강기간

11주 (2시간/주)

진행장소

강남캠퍼스

231,000원

잠시만 기다려 주세요

공석 알림 받기

선결제자가 가상 계좌 입금 대기 상태인 경우, 실질적으로 마감되었음에도 마감 임박으로 표시됩니다.
대기자 신청을 해주시면 추후 공석이 생길 경우 메일로 알람이 발송됩니다.