오픈AI, 더 똑똑해진 o1 공개 [모두레터]
오픈AI가 어려운 추론 문제를 해결하기 위한 언어 모델 'o1'을 공개했습니다! 답변을 하기 전에 더 많이 생각하여 여러 가지 전략을 시도하거나 오류들을 수정하도록 설계되어 있다고 하네요.
📮모두의연구소 공식 뉴스레터 I 모두레터 I 2024년 9월 16일
- 오픈AI, 고난이도 추론을 위한 새로운 모델 발표
- SD3M 모델을 위한 파인튜닝 튜토리얼 공개
오픈AI, 고난이도 추론을 위한 새로운 모델 발표
©OpenAI
오픈AI가 어려운 추론 문제를 해결하기 위한 언어 모델 ‘o1’을 공개했습니다. 답변을 하기 전에 더 많이 생각하여 여러 가지 전략을 시도하거나 오류들을 수정하도록 설계되어 있다고 하네요. 아직 이미지 처리와 같은 다양한 기능은 없지만 물리학, 화학, 생물학 분야의 벤치마크 테스트에서는 박사 과정 학생들과 비슷한 수준의 점수를 받았고요. 국제 수학 올림피아드 문제는 83%를 해결하여 GPT-4o의 13%보다 훨씬 높은 점수를 기록했습니다.
챗GPT 플러스, 팀 사용자들은 챗GPT에서 ‘o1-preview’ 모델과 더 가벼운 ‘o1-mini’를 사용해 볼 수 있습니다. ‘o1-preview’ 모델은 일주일에 메시지 30개, ‘o1-mini’의 경우 50개를 처리할 수 있는데요. 오픈AI는 사용량 제한을 늘리고 프롬프트에 따라 적절한 모델이 자동으로 선택되게 업데이트를 할 예정이라고 합니다.
SD3M 모델을 위한 파인튜닝 튜토리얼 공개
©베이스 모델(왼쪽)과 파인튜닝된 모델(오른쪽) ©Stability AI
스태빌리티 AI(Stability AI)가 SD3M(Stable Diffusion 3 Medium) 모델의 파인튜닝(fine-tuning) 튜토리얼을 공개했습니다. SD3M은 지난 6월에 출시된 2B 크기의 오픈 소스 모델로, 디퓨전 트랜스포머(Diffusion Transformer)를 사용해 뛰어난 성능을 보여주고 있는데요.
기존 SD1.5, SDXL 모델과 SD3M 파인튜닝의 차이점을 설명하고, SD3M 모델의 사용자를 늘리기 위해 이 튜토리얼을 작성했다고 합니다. 일반적인 파인튜닝뿐만 아니라 LoRA(Low-Rank Adaptation)를 이용한 파인튜닝 세팅도 설명하고 있고요. 스태빌리티 AI가 개발 중인 모델의 결과물 샘플도 살펴볼 수 있습니다. 이미지 생성 모델 파인튜닝에 관심이 있다면 홈페이지에 방문해 보세요!