BRS LAB
본 스터디는 BRS LAB 시즌2입니다. 시즌2는 ZOZOTOWN의 밴딧 프레임워크 오픈소스인 Open Bandit Pipeline(OBP) 라이브러리를 함께 뜯어보며, 벤딧 기반 추천시스템 파이프라인 컨셉을 이해하는 것이 목표입니다. 따라서 본 시즌의 커리큘럼은 OBP의 큰 모듈 3개(dataset, policy, off policy evaluation)를 각 토픽으로 잡아 구성하였습니다. 시즌2는 off policy evaluation을 집중적으로 다루지만, dataset과 policy에 대한 내용도 가볍게 살펴볼 예정입니다.

본 LAB은 온라인 캠퍼스로 시작하되, 향후 코로나 상황에 따라 오프라인(강남캠퍼스) 전환도 염두해두고 있습니다.
모임요일
매주 토요일
모임시간
13:30
모임장소
온라인캠퍼스
모집인원
10 명
모집방법
신청서제출 >> 랩짱 선발심사 진행
과정시작

2021년 10월 23일

가격
165,000원
연구목표
본 스터디는 BRS LAB 시즌2입니다. 시즌2는 ZOZOTOWN의 밴딧 프레임워크 오픈소스인 Open Bandit Pipeline(OBP) 라이브러리를 함께 뜯어보며, 벤딧 기반 추천시스템 파이프라인 컨셉을 이해하는 것이 목표입니다. 따라서 본 시즌의 커리큘럼은 OBP의 큰 모듈 3개(dataset, policy, off policy evaluation)를 각 토픽으로 잡아 구성하였습니다. 시즌2는 off policy evaluation을 집중적으로 다루지만, dataset과 policy에 대한 내용도 가볍게 살펴볼 예정입니다. 아래는 시즌1 때 읽은 논문 목록으로, 새로운 참여를 원하시는 분들은 참고부탁드립니다. 특히 (1)은 이번에도 다룰 예정 이므로 사전학습 부탁드립니다.
(1) A contextual-bandit approach to personalized news article recommendation, WWW 2010
(2) Collaborative Filtering Bandits, SIGIR 2016
(3) Exploitation and Exploration in a Performance based Contextual Advertising System, SIGKDD 2010
(4) A Contextual Bandit Algorithm for Mobile Context-Aware Recommender System 2012
(5) Bandit based Optimization of Multiple Objectives
on a Music Streaming Platform, SIGKDD 2020
(6) Context adaptation in interactive recommender systems, RecSys 2014

#연구_블로그_운영   
운영방식
매주 사전 학습 후 디스커션
매주 모임은 3시간 씩 진행 예정입니다.(13:30 ~ 16:30)
참여조건
- 기본적인 추천시스템에 대한 지식이 있으신 분
- Multi-Armed Bandit, Reinforcement Learning 관련 업무 또는 개발 경험이 있으신 분
활동계획
주차 학습내용
1주차 오리엔테이션 및 policy 이해
2주차 bandit feedback dataset
3주차 policy(online bandit algorithm)
4주차 off policy evaluation
https://arxiv.org/pdf/1003.5956.pdf
5주차 off policy evaluation
https://github.com/criteo-research/bandit-reco
6주차 off policy evaluation
https://github.com/criteo-research/bandit-reco
7주차 off policy evaluation
https://www.cs.cornell.edu/~adith/CfactSIGIR2016/
8주차 summary
랩짱소개
이혜진
이혜진
배우고 알아가는걸 좋아합니다. 모르면 알 때까지, 파고 또 파내는 과정을 좋아합니다. 최근 추천시스템은 강화학습과 접목이 되면서 새로운 국면을 맞은 것 같습니다. 혼자하긴 어렵지만, 함께 공부하여 또 한 번 재밌는 과정을 만들어 보고 싶습니다.
소속 l SSG.COM
E-mail l kristen91@naver.com
김준호
사용자 모델링 전반에 관심이 많은 연구 및 개발자입니다. BANDIT의 사용자의 피드백을 활용한 추천 시스템은 개인의 선호를 더 잘 반영할 것이라는 믿음을 가지고, 함께 공부 및 연구하고자 랩을 개설하게 되었습니다.
소속 l 무신사
E-mail l cs.znull@gmail.com