인공지능

DeepSeek-R1: 강화 학습 기반 추론 모델

DeepSeek-R1 과 DeepSeek-R1-Zero 가 2025년 1월 20일 오픈소스 모델로 공개되었습니다. DeepSeek-V3 모델을 기반으로 6,710 억 파라미터와 370 억 활성화된 파라미터로 MOE 를 통해 만들어졌습니다. 아울러 ‘DeepSeek-R1-Distill’ 증류모델도 공개되었는데, R1 으로 생성된 합성 데이터로 파인튜닝된 모델입니다. DeepSeek-R1: 강화 학습 기반 추론 모델 DeepSeek 는 중국 헤지 펀드인 하이-플라이어 (High-Flyer) 가 2023년에 설립한 중국의 인공지능 회사입니다. DeepSeek […]

2025.01.21|김성진

김성진모두의연구소 AIFFEL 5기

안녕하세요, 아이펠 온라인 5기 리서치 과정을 수료한 김성진입니다. 컴퓨터 기술을 활용하여 공익활동을 하는 시빅해킹을 배우고 있습니다.

목록으로 돌아가기