Again! 딥 강화학습(Deep Reinforcement Learning) Part 2.
DeepRL, ReinfocementLearning, 강화학습
시작일
20200714
진행일시
매주 화 / 19:30
모집현황
진행장소
온라인캠퍼스
시작일
20200714
진행일시
매주 화 / 19:30
모집현황
진행장소
온라인캠퍼스
온라인 only
- 본 과정은 "ZOOM"을 활용하여 온라인으로 진행됩니다.
- 온라인 풀잎 첫 참가자에게는 온라인 풀잎 전용 키트를 배송해드립니다.
(이어폰, 리액션 카드, 온라인 참여 가이드, 모두연 굿즈)
- 마지막 주는 오프라인으로 진행됩니다.
- 풀잎스쿨은 소통으로 함께 만들어나가는 모임입니다. 노트북 혹은 웹캠을 이용하여 비디오를 꼭 켜주세요.
- 본 과정은 "ZOOM"을 활용하여 온라인으로 진행됩니다.
- 온라인 풀잎 첫 참가자에게는 온라인 풀잎 전용 키트를 배송해드립니다.
(이어폰, 리액션 카드, 온라인 참여 가이드, 모두연 굿즈)
- 마지막 주는 오프라인으로 진행됩니다.
- 풀잎스쿨은 소통으로 함께 만들어나가는 모임입니다. 노트북 혹은 웹캠을 이용하여 비디오를 꼭 켜주세요.
학습대상
- 최신 강화학습의 흐름을 파악하고 싶은신 분
- 강화학습에 대한 지식을 업그레이드 하고 싶으신 분
- 부족한 부분을 채우기 위해 끊임없이 노력하시는 분
- 다른 참가자들과 함께 계속 배워가고 싶은신 분
- 영어 강의를 들어보려고 애쓰시는 분
과목난이도
쉬움 (1단계) ~ 어려움(5단계)
☘️☘️☘️☘️☘️: 해당 분야 논문 이해는 기본! 논문들을 다양하게 활용해보아요!
학습목표
강화학습 주요 알고리즘 및 이론 그리고 최신 동향을 파악합니다.
운영방식
- 사전 학습
- 한 주에 한 강의씩 순서대로 발표 및 토론
- 코드 리뷰
- 논문 리뷰
선수지식
- 강의 중 강화학습 알고리즘 활용되고 있는 기본 이론들을 따라갈 수 있는 배경 지식
- 통계적 추론
- 딥러닝 이론
학습 및 참고자료
- CS285 Fall 2019 Lecture Slide( https://rail.eecs.berkeley.edu/deeprlcourse )
- CS94-112 Fall 2018 Lecture Slide ( https://rail.eecs.berkeley.edu/deeprlcourse-fa18/ )
- CS 285 Fall 2019 Youtube ( https://www.youtube.com/playlist?list=PLkFD6_40KJIwhWJpGazJ9VSj9CFMkb79A )
- CS294-112 Fall 2018 Youtube ( https://www.youtube.com/playlist?list=PLkFD6_40KJIxJMR-j5A1mkxK26gh_qg37 )
커리큘럼
사전학습 / 이론
주차 | 학습내용 | 학습자료 |
---|---|---|
1 주차 | Introduction | |
2 주차 | Lecture 13: Variational Inference and Generative Models | Lecture 13: 슬라이드/동영상 |
3 주차 | Lecture 14: Control as Inference | Lecture 14: 슬라이드/동영상 |
4 주차 | Lecture 15: Inverse Reinforcement Learning | Lecture 15: 슬라이드/동영상 |
5 주차 | Lecture 16: Transfer and Multi-task Learning | Lecture 16: 슬라이드/동영상 |
6 주차 | Lecture 17: Distributed RL | Lecture 17: 슬라이드/동영상상 |
7 주차 | Lecture 18: Exploration (Part 1) | Lecture 18: 슬라이드/동영상 |
8 주차 | Lecture 19: Exploration (Part 2 | Lecture 19: 슬라이드/동영상 |
9 주차 | Lecture 20: Meta-learning | Lecture 20: 슬라이드/동영상 |
10 주차 | Lecture 21: Information Theory, Open Problems | Lecture 21: 슬라이드/동영상 |
11 주차 | AutoML: Automated Machine Learning ( Fall 2018, CS294-112 Lecture 25) *변경될 수 있음 | Fall 2018, CS294-112 Lecture 25: 슬라이드/동영상 |
퍼실소개
조원양
영상감시 업체에서 개발도 하고 팀도 이끌고 있습니다. 강화학습/비전에 많은 관심을 가지고 있고 계속 학습 중입니다. 작년에 CS 285 (CS294-112) 풀잎에 참여한 후, 강화학습 관련 논문을 계속 보면서 다시 한번 CS285의 매력에 제대로 빠져보기 위해 개설하게 되었습니다.
영상감시 업체에서 개발도 하고 팀도 이끌고 있습니다. 강화학습/비전에 많은 관심을 가지고 있고 계속 학습 중입니다. 작년에 CS 285 (CS294-112) 풀잎에 참여한 후, 강화학습 관련 논문을 계속 보면서 다시 한번 CS285의 매력에 제대로 빠져보기 위해 개설하게 되었습니다.
강화학습 최고의 명강의인 UC 버클리대 CS 2285 : 딥 강화학습(Deep Reinforcement Learning) 강의를 한 주에 한 강의 씩 따라가며 강화학습 이론의 큰 줄기와 최신 연구 동향을 파악할 수 있는 과정입니다. 본 과정은 총 21강으로 이루어져 있으며 풀잎스쿨 11기부터 12기까지 이어집니다. 이 번에는 Part 2 후반부 Lecture 13 (https://rail.eecs.berkeley.edu/deeprlcourse/) 부터 진행됩니다.