
한 줄 소개
엔비디아 RAPIDS 응용 방안에 대한 탐구 및 경험 연구, RAPIDS LAB 시즌 2
분야
ENGINEERING
목표 결과물
OPEN_SOURCE, PAPER
랩 소개
본 랩은 NVIDIA에서 제공하고 있는 RAPIDS를 활용하여 오픈소스 기반 End-to-End Full GPU-based AutoML system 개발을 연구하고자합니다. 시즌 1에서 제작된 책을 기반으로 RAPIDS를 공부하고, 기존의 AutoML들을 실험할 예정이며. RAPIDS기반 Data Engineering Framework인 NVTabular와 GPU Management를 위한 RAY, XGBoost, LightGBM, CatBoost, RandomForest의 GPU버전을 활용하여 AutoML System을 구축하고자합니다. 구현 결과에 대한 벤치마킹을 위해 openML Dataset을 활용할 예정이며, 배운 지식을 기반으로 혹은 연구 중 자유롭게 Kaggle을 도전하셔도 무방합니다. 결과물을 pypi나 conda등에 올라갈 예정이며, 가능하면 논문화 하여 논문을 투고하거나 혹은 GTC등에 출품할 예정입니다. RAPIDS LINK : https://rapids.ai/ RAPIDS NGC : https://catalog.ngc.nvidia.com/orgs/nvidia/teams/rapidsai/containers/base RAPIDS LAB 시즌 1 결과물 : https://wikidocs.net/book/13459
운영 방식
온라인으로 운영될 예정이며, 2주에 한번 모일 예정입니다. 기본적으로 각자 공부한 것을 발표 및 공유할 예정이며, 공부하는 것에 대한 제한은 없습니다. 자유롭게 공부 하되, 같은 주제를 가지고 공부할 예정입니다. 기존의 RAPIDS Lab분들과 같이 RAPIDS 기본 스터디 후, AutoML 공부, Kaggle등의 활용. open source 제작등의 순서로 진행할 예정입니다.
커리큘럼
[첫 모임] (1주) OT, 자기소개, 목표 소개
[초기 준비단계] (1달 ~ 2달) RAPIDS 학습 및 응용
[프로젝트 비교군 준비 단계] (1달 ~ 2달) Autogluon, LightAutoML등 전통적인 ML기반 AutoML 탐색
[프로젝트 벤치 마크 단계] (1달 ~ 2달) openML Dataset들 활용 하여 AutoML 실행
[프로젝트 설계 및 개발 단계] (2달 ~ 3달) 기술 아키텍쳐 설계 및 프로토 타입 개발
[테스트 및 검증 단계] (1달 ~ 2달) benchmark를 통한 비교
[배포 및 출시 단계] (1달 ~ 2달) 최종 검토 및 배포, 논문화 검토
[추가 단계] (자율~) 논문 진행 및 작업물을 활용한 Kaggle 도전
참여 요건
Pandas, Scikit-learn, Numpy등 기초 데이터 과학 라이브러리를 활용해본 분. Kaggle등을 시도 해 보신 분. GPU기반 DL등을 시도해보신 분. Python이 익숙하신분. 모두 해당 안되더라도 열심히 해보실 분
사전 질문
기존에 Tree-based ML을 다루어보셨나요?
Machine Learning 단계 중 HPO와 Feature Selection, Model Selection등을 경험해보셨나요?
GPU기반 Data Science를 들어보셨나요?
Kaggle은 시도해보신적 잇나요?
Docker, Conda, Pip등을 사용하여 환경을 직접 세팅해보신 적 있나요??
NVIDIA GPU를 소유하고 계신가요? 혹은 사용할 수 있는 환경인가요?
Pandas, Scikit-learn, Numpy를 활용해보셨나요?
랩장 소개

이제영
가톨릭 대학교 Computer Vision & Machine Intelligence lab에서 뇌파 기반 이미지 생성모델 연구를 주제로 박사를 졸업하였습니다. 컴퓨터 비전 전반에 관한 관심을 가지고 있습니다. 스마트 팜을 위한 오리 detection, 세포 이미지 생성등 의 산학 연구를 꾸준히 해오며, 국내 포스터 및 JAST, CAVW에 1저자로 논문을 제출 했으며, 현재 다양한 탑티어 논문에 도전하고 있습니다. 2019년도부터 NVIDIA Deep Learning Institute 와 인연을 시작하여 2021년부터 NVIDIA DLI Ambassador로 활동 중입니다. 주로 데이터 과학, 데이터 과학 가속화와 관련한 강의를 진행하며 가톨릭 대학교, 서울과학기술대학교, 한컴 아카데미, 리더스 시스템즈 등에서 NVIDIA DLI 워크숍 강의 진행 경험이 있으며 2022년 ~ 현재 가톨릭 대학교 시간 강사, 2023년 숭실대학교 시간 강사로 활동 중에 있습니다.
NVIDIA - Data Science with RAPIDS LAB Season2
모임 기간
2026.01.05 - 2027.01.04
모임 일시
격주 수요일 20:00 ~ 22:00
장 소
온라인
모집 기간
2025.11.17 - 2026.01.01
모집 인원
8명
선발 방식
사전 질문 기반 심사 + 온라인 커피챗
