BRS LAB

모임요일: 매주 토요일

모임시간: 13:30

모임장소: 온라인캠퍼스

모집인원: 10 명

모집방법: 신청서제출 >> 랩짱 선발심사 진행

과정시작: 2021년 10월 23일

가격: 165,000원

활동 종료

모집 알림 받기

연구목표

본 스터디는 BRS LAB 시즌2입니다. 시즌2는 ZOZOTOWN의 밴딧 프레임워크 오픈소스인 Open Bandit Pipeline(OBP) 라이브러리를 함께 뜯어보며, 벤딧 기반 추천시스템 파이프라인 컨셉을 이해하는 것이 목표입니다. 따라서 본 시즌의 커리큘럼은 OBP의 큰 모듈 3개(dataset, policy, off policy evaluation)를 각 토픽으로 잡아 구성하였습니다. 시즌2는 off policy evaluation을 집중적으로 다루지만, dataset과 policy에 대한 내용도 가볍게 살펴볼 예정입니다. 아래는 시즌1 때 읽은 논문 목록으로, 새로운 참여를 원하시는 분들은 참고부탁드립니다. 특히 (1)은 이번에도 다룰 예정 이므로 사전학습 부탁드립니다.
(1) A contextual-bandit approach to personalized news article recommendation, WWW 2010
(2) Collaborative Filtering Bandits, SIGIR 2016
(3) Exploitation and Exploration in a Performance based Contextual Advertising System, SIGKDD 2010
(4) A Contextual Bandit Algorithm for Mobile Context-Aware Recommender System 2012
(5) Bandit based Optimization of Multiple Objectives
on a Music Streaming Platform, SIGKDD 2020
(6) Context adaptation in interactive recommender systems, RecSys 2014

#연구_블로그_운영

운영방식

매주 사전 학습 후 디스커션
매주 모임은 3시간 씩 진행 예정입니다.(13:30 ~ 16:30)

참여조건

- 기본적인 추천시스템에 대한 지식이 있으신 분
- Multi-Armed Bandit, Reinforcement Learning 관련 업무 또는 개발 경험이 있으신 분

활동계획

주차	학습내용
1주차	오리엔테이션 및 policy 이해
2주차	bandit feedback dataset
3주차	policy(online bandit algorithm)
4주차	off policy evaluation https://arxiv.org/pdf/1003.5956.pdf
5주차	off policy evaluation https://github.com/criteo-research/bandit-reco
6주차	off policy evaluation https://github.com/criteo-research/bandit-reco
7주차	off policy evaluation https://www.cs.cornell.edu/~adith/CfactSIGIR2016/
8주차	summary

랩짱소개

이혜진

배우고 알아가는걸 좋아합니다. 모르면 알 때까지, 파고 또 파내는 과정을 좋아합니다. 최근 추천시스템은 강화학습과 접목이 되면서 새로운 국면을 맞은 것 같습니다. 혼자하긴 어렵지만, 함께 공부하여 또 한 번 재밌는 과정을 만들어 보고 싶습니다.

소속 l SSG.COM
E-mail l kristen91@naver.com

김준호

사용자 모델링 전반에 관심이 많은 연구 및 개발자입니다. BANDIT의 사용자의 피드백을 활용한 추천 시스템은 개인의 선호를 더 잘 반영할 것이라는 믿음을 가지고, 함께 공부 및 연구하고자 랩을 개설하게 되었습니다.

소속 l 무신사
E-mail l cs.znull@gmail.com