##llm
##robot
##imitation
##policy
Like_Human LAB
모임 기간
2025.04.12 - 2025.07.26
모임 일시
매주 화요일 19:00 ~ 21:00
장 소
온라인
모집 기간
2025.04.12 - 2025.04.25
모집 인원
4명
선발 방식
사전 질문 기반 심사 + 온라인 커피챗
랩 소개
운영 방식
참여 요건
랩장 소개
⭐️ 랩 소개
한 줄 소개
인간 모방 학습과 명령 이해
분야
ENGINEERING, NATURAL_SCIENCES
목표 결과물
PAPER, OPEN_SOURCE
본 프로젝트를 위한 모임은 로봇이 인간의 동작을 모방하여 빠르게 학습하는 인간 모방 학습 기법을 연구합니다. 시뮬레이션 환경과 단일 시연 학습을 활용하여 로봇 전용 데이터 수집의 어려움을 극복합니다. 자연어 및 음성 명령을 이해해 시각 정보와 결합, 로봇이 상황에 맞는 동작 정책을 생성하도록 합니다. 이를 통해 의료, 재활, 제조, 가정 등 다양한 분야에서 로봇팔이 실제 생활을 지원할 수 있도록 합니다. 기술 구현에는 안전성, 정확도, 실시간 동작 처리 등이 중요한 과제로 다뤄집니다.
⭐️ 운영 방식
5명의 인원으로 진행되는 것을 생각하고 있습니다.
초반 약 4주간 오프라인과 온라인을 병행하며 강화학습 스터디를 진행합니다. 스터디는 강의를 같이 공부하며 대표가 요약을 진행하고 궁금한 점들을 공유하며 해결하는 방식으로 진행합니다. 대부분의 오프라인 미팅은 수원에서 진행하는 것을 생각하고 있습니다.
이후 논문을 쓰는 작업으로 들어갑니다. 각자 맡아야 할 부분들을 나눠서 논문의 베이스가 되는 코드를 작성하며, 구현을 하기 힘들거나 오래 지체되는 부분은 미리 끝낸 팀원이 도와줍니다.
이때 베이스라인이 완성이 됐다면, 벤치마크를 통한 성능 평가와 앞으로 모델의 성능을 개선하기 위한 논문 공부 그리고 코드 반영, 피드백이 순서대로 반복되어 이루어집니다.
최종적으로 해외의 저널에 논문을 게재하고 관련 코드를 오픈소스화하는 것을 목표로 하고 있습니다.
⭐️ 커리큘럼
1주차: 상호 소개 및 커리큘럼 소개, 앞으로 진행될 강화학습에 대한 간단한 설명
2주차: 강의 내용 요약 및 질문 그리고 피드백
3주차: 강의 내용 요약 및 질문 그리고 피드백
4주차: 강의 내용 요약 및 질문 그리고 피드백
5주차: OCTO 논문 및 RT-2에 대한 논문 리뷰, 앞으로의 역할 분담 및 진행 방향 소개
6주차: 코드 구현 리뷰 및 개선점 파악, 데이터 전처리 및 로봇 환경 세팅
7주차: 전체적인 코드 구현 완료, 벤치마크를 통한 로봇 성능 평가
8주차: 성능 개선을 위한 논문 리뷰, 코드 반영, 피드백
9주차: 성능 개선을 위한 논문 리뷰, 코드 반영, 피드백
10주차: 최종 모델 아키텍쳐 확정 및 모델의 파라미터 및 Weight 세부조정
11주차: 모델의 파라미터 및 Weight 세부조정을 통한 최종 Performance 측정
12주차: 코드 정리 및 논문 작성, 피드백을 통한 논문 보완
⭐️ 참여 요건
Python에 거부감이 없는 사람
논문 리뷰가 어렵지 않게 느껴지는 사람
여러 인원과 코드 구현을 해본 사람
수원 율전동에서 오프라인 미팅을 하는 것에 거부감이 없는 사람
의견이 잘 맞지 않아도 둥글게 풀어갈 수 있는 사람
⭐️ 사전 질문
가장 최근에 읽으신 논문이 무엇이고 어떤 내용에서 흥미를 느끼셨는지 알려주세요.
가장 기억에 남는 코드 구현이 필요했던 프로젝트를 소개하고, 어떤 부분에서 어려움을 겪으셨는지 알려주세요.
Transformer의 어떠한 요소가 모델에 있어 좋은 성능을 낼 수 있는지 알려주세요.
어떤 경우에 Transformer가 큰 힘을 발휘하지 못하는지 예시와 이유를 들어서 설명해주세요.
연구가 왜 하고 싶으신지 알려주세요.
⭐️ 랩장 소개

김호재
성균관대학교 동아리 SKKAI · attapapa@naver.com
저는 팀을 하나로 이끌고 문제를 해결하는 리더십 역량을 강점으로 가지고 있습니다.
최근에는 3D Gaussian Splatting을 활용한 스마트팩토리 품질검사 프로젝트에서 팀장으로 활동하며, 기술 설계부터 데이터 수집, 모델 구현, 성능 개선까지 전 과정을 주도했습니다. 복잡한 3D 복원 기술과 산업 현장의 요구사항을 연결하는 역할을 맡아, 팀원들과 함께 품질 검사 자동화를 위한 AI 솔루션을 개발했습니다.
이 과정에서 각 팀원의 기술 역량을 고려한 역할 분담과 개발 일정 조율, 품질지표 분석 및 기술 스택 결정까지 리더로서의 종합적인 판단 능력을 발휘했습니다. 또한 외부 발표와 보고서 작성도 맡아 프로젝트 성과를 효과적으로 전달하고, 기술적 신뢰도를 높였습니다.
저는 기술적인 깊이와 더불어 사람과의 협업, 갈등 해결, 의사결정 능력을 고루 갖춘 리더로 성장해왔으며, 앞으로도 이러한 리더십을 기반으로 팀과 함께 더 큰 가치를 만들어가고자 합니다.