Multi-RL Env LAB
모임 기간
2024.05.04 - 2024.07.20
모임 일시
매주 토요일 11:00 ~ 13:00
장 소
온라인
모집 기간
2024.04.15 - 2024.04.30
모집 인원
5명
선발 방식
사전 질문 기반 심사
랩 소개
운영 방식
참여 요건
랩장 소개
⭐️ 랩 소개
한 줄 소개
시계열 데이터 환경 기반 멀티에이전트 강화학습 오픈소스 라이브러리를 개발
분야
ENGINEERING
목표 결과물
OPEN_SOURCE
Multi-RL Env LAB은 다양한 시계열 신호와 pettingzoo 라이브러리를 바탕으로 시계열 데이터 환경 기반 멀티에이전트 강화학습 오픈소스 라이브러리를 개발하는 것을 목적으로 하는 랩입니다.
다양한 시계열 데이터 분석 전문가 분들이 모여, 멀티에이전트 강화학습을 공부하고, 파이썬 라이브러리를 개발하여 라이브러리 등록(pip)까지 해보는 것을 목표로 합니다.
고려하고 있는 시계열 데이터와 강화학습 모델 학습 예시는 다음과 같습니다.
1) 생체 신호 - 심전도, 뇌파를 이용한 멀티 에이전트 기반 혈압 예측 / 수면 품질 분류
2) 주식 - 주가 변동성 예측 / 주식 분야별, 포트폴리오 분류
3) 크립토 - 암호화폐 가격 변동성 예측 등
그 외에 적용할 수 있는 시계열 데이터도 저희 랩에서 논의하면서 개발하면 좋겠습니다.
⭐️ 운영 방식
총 12주 활동 계획 중에 있습니다. (개발이 빠르게 완료되면 단축될 수 있습니다.)
매주 토요일 온라인 세미나 진행
- 강화학습에 대한 사전 지식 및 코드 중심의 멀티에이전트 환경 리뷰
- Single-agent 및 Multi-agent에 관한 강화학습 모델 리뷰
- open ai gym, pettingzoo 환경 리뷰
- 개발 진행과 관련한 주간 이슈 공유
- 깃허브를 통한 개발 및 개발 버전 pip 관리 및 마일스톤 업데이트
- 제작완료 후, 라이브러리가 인용이 가능하도록 라이브러리 내용보고서를 출판전 논문 사이트에 (arxiv, engrxiv 등) 게재
⭐️ 커리큘럼
⭐️ 참여 요건
멀티에이전트 강화학습 및 시계열 데이터에 관심이 많은 분
(우대) 강화학습 활용 논문 발표 경험이 있는 분
(우대) 깃허브 및 리눅스 명령어 활용이 능숙한 분
⭐️ 사전 질문
Multi-RL Env LAB의 멤버로 활동하고 싶은 이유가 무엇인가요?
자신만의 강화학습 모델 코드를 작성해보셨거나, 논문을 작성, 발표해보신 적 있으신가요? 논문을 게재하신적이 있다면 링크를 첨부해주세요.
저희 랩에서 어떤 부분을 기여하실 수 있으신지 말씀 부탁드립니다.
관심 있는 시계열 데이터가 있으신가요? (예 : 심전도, 주식 등)
지원자가 많은 경우, 별도 온라인 미팅을 진행하여 최종 선발할 계획입니다. 연락 드리는 것에 대해 동의하시나요?
⭐️ 랩장 소개
한승우
도쿄농공대학 · seungwoohan0108@gmail.com
안녕하세요. 저는 일본 도쿄농공대학에 박사과정으로 재학중인 한승우입니다. 석사는 광운대학교에서 머신러닝을 이용한 부정맥 분류 연구를 진행하였고, 전문연구요원 복무만료 후, 모두연에서 Multi-RL Env LAB이라는 랩을 만들어 멀티에이전트 강화학습 공부를 하였습니다. (참고 : https://modulabs.co.kr/product/lab-16165-2024-03-29-032220/). 도쿄농공대학에서의 주제는 동물과 인간의 감정을 AI로 분류하는 것을 목표로 하고 있습니다.