RLAIF Vision LAB | LAB | 모두의연구소

LAB

RLAIF Vision LAB

10월 7일

11:00 - 13:00

WEEKLYSAT요일

온라인

5명

홈 피드 채팅

한 줄 소개

Reinforcement Learning from Human&AI Feedback

분야

ENGINEERING, ARTS

목표 결과물

PAPER

랩 소개

저희는 사람의 피드백을 학습에 반영하여 stable diffusion과 같은 시각 생성 모델을 고도화하는 방법을 연구합니다. 시각 생성 모델은 평가요소에 심미성이 있어 평가가 모호하다는 한계가 있습니다. 인간의 눈으로 평가한다해도, 이 평가를 기반하여 모델을 고도화하기는 더욱 어렵습니다. 이미지 생성 모델의 성능을 극도로 높이기 위해서는, 결국 사람의 피드백을 받아 학습하는 기법이 꼭 필요합니다. 얼마 지나지 않아 생성모델의 핵심 분야로 떠오를 것이라 자신합니다. 따라서, 본 LAB은 Reinforment Leanging from Human&AI Feedback for Visuals 연구를 목표로 합니다. 산출물은 논문을 목표로 합니다.

운영 방식

연구 조사->인사이트->가설->실험->결론 반복(1사이클은 1~2주) 작은 연구 성과를 반복하여 쌓아올리고, 이를 조직화하여 하나의 결론을 도출하고, 논문으로 완성할 것 입니다. (페이퍼샵)

참여 요건

딥러닝 관련 업무 혹은 연구 경험 2년 이상 일주일 최소 3시간의 시간 확보가능

사전 질문

동기

랩장 소개

김형섭

코드잇•times213@naver.com

RLAIF Vision LAB

모임 기간

2023.10.07 -

모임 일시

매주 토요일 11:00 ~ 13:00

장 소

온라인

모집 기간

2023.09.23 - 2024.01.31

모집 인원

5명

선발 방식

사전 질문 기반 심사