DeepSeek-R1: 강화 학습 기반 추론 모델
DeepSeek-R1 과 DeepSeek-R1-Zero 가 2025년 1월 20일 오픈소스 모델로 공개되었습니다. DeepSeek-V3 모델을 기반으로 6,710 억 파라미터와 370 억 활성화된 파라미터로 MOE 를 통해 만들어졌습니다. 아울러 ‘DeepSeek-R1-Distill’ 증류모델도 공개되었는데, R1 으로 생성된 합성 데이터로 파인튜닝된 모델입니다. DeepSeek-R1: 강화 학습 기반 추론 모델 DeepSeek 는 중국 헤지 펀드인 하이-플라이어 (High-Flyer) 가 2023년에 설립한 중국의 인공지능 회사입니다. DeepSeek […]
2025.01.21|김성진
김성진모두의연구소 AIFFEL 5기