랩 썸네일
LAB
Hello, NPU LAB
6월 24일 - 12월 23일
19:30 - 21:30
WEEKLYWED요일
모두의연구소 강남캠퍼스
10

한 줄 소개

리벨리온 NPU에 AI 모델을 올리고 컴파일, 서빙, 벤치마크해 보는 오프라인 랩

분야

ENGINEERING

목표 결과물

ETC, PAPER

랩 소개

소개페이지 : https://invitation-silk-eta.vercel.app/ Hello, NPU: AI 모델을 가속기 위에 직접 올려보며 NPU를 손으로 익히는 6개월 실험형 교육 랩입니다. LLM과 생성형 AI가 폭발적으로 늘면서 추론 비용과 효율이 핵심 과제가 됐습니다. GPU만으로는 전력과 처리량에 한계가 있어, 추론에 특화된 NPU (Neural Processing Unit)가 유력한 대안으로 떠올랐습니다. 그러나 NPU를 실제로 다뤄본 사람은 아직 드물고, "AI 모델을 NPU 위에 어떻게 올리는가" 같은 가장 기본적인 질문조차 정리된 문서가 부족합니다. 이 랩은 국내 데이터센터급 리벨리온 NPU 구동 환경 위에서, 시장에서 널리 쓰이는 AI 모델을 직접 컴파일, 서빙, 벤치마크해 보는 실험형 교육 랩입니다. ResNet 같은 비전 모델과 LLM (Gemma, Llama 등), CV/NLP·멀티모달 파운데이션 모델을 단계적으로 NPU 위에 올려봅니다. 그 과정의 실전 이슈(컴파일 에러, 정밀도 손실, 처리량 저하 등)를 함께 디버깅하고, 해결 과정을 매뉴얼로 정리합니다. 정리한 매뉴얼은 이후 워크숍 세미나와 논문으로 이어지며, 생명과학 등 도메인 모델로의 확장도 이후 단계에서 검토합니다. 대상: NPU, 가속기, 모델 추론 최적화에 관심 있는 대학원생, 연구원, 엔지니어. 딥러닝 기초 (파이토치 수준)와 트랜스포머 모델에 대한 기본 이해가 있으면 충분하며, 특정 도메인 사전 지식은 요구하지 않습니다. 모델을 직접 가속기에 올려본 경험을 갖고 싶은 분께 권합니다. 참여 혜택: 리벨리온 NPU 구동 환경(원격 접속) 제공, RBLN SDK 지원, 세미나 및 문의 채널을 통한 Q&A 지원, vLLM/Triton 쿡북 등 자료 제공, 매뉴얼 용역 참여, 세미나 발표 1회당 100만원 제공.

#llm
#논문
#npu
#vllm
#triton
#리벨리온
#rbln

운영 방식

기간: 2026년 6월 중순부터 12월까지 6개월 동안 진행합니다. 이후 후속 트랙(세미나, 논문)은 별도로 안내합니다. 정기 모임: 오프라인 중심, 매주 수요일 저녁 회당 1시간 30분 세미나 단위로 진행합니다. 발표, 코드 실습, 디버깅, 디스커션을 한 자리에서 풀어갑니다. NPU를 다루는 작업 특성상 환경 이슈, 드라이버 문제, 컴파일 에러가 잦으므로, 반드시 같은 공간에서 함께 손을 움직이며 풀어가는 방식을 기본으로 합니다. 사전 학습: 매주 모임 전날까지 다음 회차 자료와 환경 셋업 가이드를 디스코드에 사전 공유합니다. 사전 학습은 1~2시간 분량으로, 본 모임에서는 사전 학습 내용을 전제로 실습과 디스커션에 집중합니다. 커뮤니케이션: 디스코드 채널을 상시 운영하여 환경 설정, 디버깅, 자료 공유 등 일상 커뮤니케이션을 진행합니다. 리벨리온 엔지니어 교육 세션은 하반기 1~2회 예정이며, 세션 외 문의는 별도 채널이나 메일로 Q&A를 해소합니다. (연계 hands-on 행사가 있을 경우 참여 안내) 산출물 작성 환경: 매뉴얼은 Markdown으로 GitHub 조직 저장소에 작성하며, 실습 코드도 같은 저장소에서 함께 관리합니다. 모든 챕터는 Docker 또는 스크립트 기반 재현 환경과 함께 제출하여, 외부에서 그대로 따라 할 수 있도록 합니다. 산출물 분담 원칙: 6개월 동안 각자 매뉴얼 1~2개 챕터를 주저자로 맡고, 동료 챕터를 peer review합니다. 챕터 단위는 "NPU 소개와 RBLN SDK 개요", "특정 모델군의 NPU 이식 가이드", "특정 도구나 기법의 사용법" 등으로 나뉩니다. 세미나 발표는 랩원이 순환하여 담당하며, 1회 발표는 1인이 메인으로 가져가는 구조를 권장합니다 (분담은 OT에서 합의).

커리큘럼

[초기 준비 단계] (1개월 차): 오리엔테이션, 챕터 분담, NPU 아키텍처와 RBLN SDK 입문, 개발 환경 셋업

[NPU 기초 학습 단계] (1~2개월 차): 기본 모델 RBLN 컴파일 실습, 컴파일러 워크플로 심화, 양자화와 성능 튜닝

[LLM 및 파운데이션 모델 이식 단계] (3~4개월 차): vLLM 기반 LLM 추론, Triton 멀티 모델 서빙, CV/NLP 파운데이션

[응용 사례 분석 단계] (4~5개월 차): 실전 활용 모델 (인기 LLM·비전·멀티모달 모델 등 택일) NPU 이식 시도와 한계 분석

[매뉴얼 정리 및 산출물 제출 단계] (5~6개월 차): 매뉴얼 초안 마감, peer review, 최종본 제출, 후속 트랙 연계

참여 요건

소개페이지 : https://invitation-silk-eta.vercel.app/ 모집 정원: 10~11명 (타이트한 선발). 끝까지 참여해 산출물을 함께 만들 수 있는 분만 선발합니다. 모집 대상: NPU, 가속기, 모델 추론 최적화에 관심 있는 대학생, 대학원생, 연구원, 엔지니어. 딥러닝 기초 (파이토치 수준)와 트랜스포머 모델에 대한 기본 이해가 있는 분. 우대 사항: 포기는 없다, 같이 끝까지 공부할 수 있는 분. 지원 절차: 1. 사전 과제 제출 (지원서와 함께) 2. 오프라인 면접 (서류 통과자, 약 20분). 사전 과제를 함께 보며 학습 동기와 협업 태도를 확인합니다. 3. 합격 통보 및 OT 일정 공지

사전 질문

[yes or no] 소개페이지 확인하셨습니까? https://invitation-silk-eta.vercel.app/

[yes or no] 오픈 톡방에 참여해 주셨습니까. -> 소개페이지 상단

[yes or no] 과제 내용을 확인하셨습니까? -> 소개페이지 상단

[yes or no] 과제 제출 링크를 확인하셨습니까? -> 소개페이지 상단

[yes or no] 선발 일정을 확인하셨습니까? -> 소개페이지 상단

랩장 소개

avatar_img

조현욱

42Maruacerghjk@gmail.com