인공지능

DeepSeek-R1: 강화 학습 기반 추론 모델

DeepSeek가 6,710억 파라미터 규모의 MOE 기반 오픈소스 모델 R1/R1-Zero를 증류모델과 함께 공개했다.

2025.01.21|김성진

DeepSeek-R1: 강화 학습 기반 추론 모델
김성진
김성진모두의연구소 AIFFEL 5기
안녕하세요, 아이펠 온라인 5기 리서치 과정을 수료한 김성진입니다. 컴퓨터 기술을 활용하여 공익활동을 하는 시빅해킹을 배우고 있습니다.