Lab Image

BRS LAB

모임 기간

2021.10.23 - 2022.01.01

모임 일시

매주 토요일 10:30 ~ 12:30

장      소

온라인

모집 기간

2021.10.08 - 2021.10.22

모집 인원

10명

선발 방식

사전 질문 기반 심사

랩 소개
운영 방식
참여 요건
랩장 소개

⭐️ 랩 소개

한 줄 소개
본 스터디는 BRS LAB 시즌2입니다. 시즌2는 ZOZOTOWN의 밴딧 프레임워크 오픈소스인 Open Bandit Pipeline(OBP) 라이브러리를 함께 뜯어보며, 벤딧 기반 추천시스템 파이프라인 컨셉을 이해하는 것이 목표입니다. 따라서 본 시즌의 커리큘럼은 OBP의 큰 모듈 3개(dataset, policy, off policy evaluation)를 각 토픽으로 잡아 구성하였습니다. 시즌2는 off policy evaluation을 집중적으로 다루지만, dataset과 policy에 대한 내용도 가볍게 살펴볼 예정입니다. <br> <br> 본 LAB은 온라인 캠퍼스로 시작하되, 향후 코로나 상황에 따라 오프라인(강남캠퍼스) 전환도 염두해두고 있습니다.
분야
ETC
목표 결과물
ETC
본 스터디는 BRS LAB 시즌2입니다. 시즌2는 ZOZOTOWN의 밴딧 프레임워크 오픈소스인 Open Bandit Pipeline(OBP) 라이브러리를 함께 뜯어보며, 벤딧 기반 추천시스템 파이프라인 컨셉을 이해하는 것이 목표입니다. 따라서 본 시즌의 커리큘럼은 OBP의 큰 모듈 3개(dataset, policy, off policy evaluation)를 각 토픽으로 잡아 구성하였습니다. 시즌2는 off policy evaluation을 집중적으로 다루지만, dataset과 policy에 대한 내용도 가볍게 살펴볼 예정입니다. 아래는 시즌1 때 읽은 논문 목록으로, 새로운 참여를 원하시는 분들은 참고부탁드립니다. 특히 (1)은 이번에도 다룰 예정 이므로 사전학습 부탁드립니다. <br/> (1) A contextual-bandit approach to personalized news article recommendation, WWW 2010<br/> (2) Collaborative Filtering Bandits, SIGIR 2016<br/> (3) Exploitation and Exploration in a Performance based Contextual Advertising System, SIGKDD 2010<br/> (4) A Contextual Bandit Algorithm for Mobile Context-Aware Recommender System 2012<br/> (5) Bandit based Optimization of Multiple Objectives<br/> on a Music Streaming Platform, SIGKDD 2020<br/> (6) Context adaptation in interactive recommender systems, RecSys 2014<br/>

⭐️ 운영 방식

매주 사전 학습 후 디스커션<br/> 매주 모임은 3시간 씩 진행 예정입니다.(13:30 ~ 16:30)

⭐️ 커리큘럼

1주차: 오리엔테이션 및 policy 이해
2주차: bandit feedback dataset
3주차: policy(online bandit algorithm)
4주차: off policy evaluation (https://arxiv.org/pdf/1003.5956.pdf)
5주차: off policy evaluation (https://github.com/criteo-research/bandit-reco)
6주차: off policy evaluation (https://github.com/criteo-research/bandit-reco)
7주차: off policy evaluation (https://www.cs.cornell.edu/~adith/CfactSIGIR2016/)
8주차: summary

⭐️ 참여 요건

- 기본적인 추천시스템에 대한 지식이 있으신 분<br/> - Multi-Armed Bandit, Reinforcement Learning 관련 업무 또는 개발 경험이 있으신 분

⭐️ 사전 질문

자기소개를 기술해주세요. (업무/도메인/경력을 포함해주세요)
Matrix Factorization계열 알고리즘 동작원리와 문제점이 무엇인지 기술해주세요.
현재 업무에서 직면한 추천 이슈 및 해결방식에 대해 자유롭게 기술해주세요
추천시스템 파이프라인 구축경험을 기술해주세요.

⭐️ 랩장 소개

avatar_img
이혜진
데이터분석 · kristen91@naver.com
배우고 알아가는걸 좋아합니다. 모르면 알 때까지, 파고 또 파내는 과정을 좋아합니다. 최근 추천시스템은 강화학습과 접목이 되면서 새로운 국면을 맞은 것 같습니다. 혼자하긴 어렵지만, 함께 공부하여 또 한 번 재밌는 과정을 만들어 보고 싶습니다.