클로드 이제 컴퓨터도 직접 조작한다? – 앤트로픽의 AI 에이전트 [모두레터]
앤트로픽이 클로드 3.5 시리즈의 새로운 모델 ‘클로드 3.5 하이쿠’와 업그레이드된 ‘클로드 3.5 소네트’를 공개했습니다.
📮모두의연구소 공식 뉴스레터 I 모두레터 I 2024년 10월 28일
- 클로드, 이제 컴퓨터도 직접 조작한다?
- 이미지 생성 AI ‘스테이블 디퓨전 3.5’ 오픈 소스 공개
클로드 이제 컴퓨터도 직접 조작한다?
Claude | Computer use for automating operations
With the upgraded Claude 3.5 Sonnet, we’re introducing a new capability in beta: computer use. Developers can now direct Claude to use computers the way people do-by looking at a screen, moving a cursor, clicking, and typing text. At this stage, it is still experimental-at times cumbersome and error-prone.
앤트로픽이 클로드 3.5 시리즈의 새로운 모델 ‘클로드 3.5 하이쿠(Claude 3.5 Haiku)’와 업그레이드된 ‘클로드 3.5 소네트(Claude 3.5 Sonnet)’를 공개했습니다. 클로드 3 시리즈에서 하이쿠 모델은 속도와 비용에 집중한 경량 모델이었는데요. 이번 업데이트에서는 하이쿠 모델이 이전에 가장 큰 모델이었던 ‘클로드 3 오푸스(Claude 3 Opus)’와 비슷한 성능을 기록했다고 합니다.
이번 클로드 3.5 소네트에 추가된 ‘컴퓨터 사용(computer use, 일종의 AI 에이전트 기능)’도 화제가 되고 있습니다. 이제 언어 모델이 텍스트와 이미지를 이해하는 것을 넘어 컴퓨터까지 사용할 수 있게 되었는데요. 사용자의 명령에 따라 화면에서 마우스를 움직이고, 버튼을 클릭하고, 텍스트를 입력하는 등 사람이 컴퓨터를 사용하는 것처럼 컴퓨터 화면을 조작할 수 있다고 합니다.
이미지 생성 AI ‘스테이블 디퓨전 3.5’ 오픈 소스 공개
©HuggingFace
스태빌리티 AI가 텍스트에서 이미지를 생성하는 AI 모델 ‘스테이블 디퓨전 3.5(Stable Diffusion 3.5)’를 출시했습니다. 프롬프트에 대한 높은 정확도와 고품질 이미지 생성에 중점을 두고 설계된 ‘스테이블 디퓨전 3.5 라지(Large)’와 라지 모델의 간소화된(라지보다 훨씬 빠른) 버전인 ‘스테이블 디퓨전 3.5 라지 터보(Large Turbo)’가 오픈 소스로 공개되었어요. 비상업적인 용도로는 무료로 사용 가능하고, 연 매출 100만 달러 이하의 기업은 상업적 사용도 가능하다고 합니다.
스테이블 디퓨전 3.5는 파인튜닝(fine-tuning)이 쉬워서 원하는 이미지를 생성하거나 애플리케이션을 개발하기 편하고, 고성능 장비 없이도 모델을 사용할 수 있다고 하는데요. 3D, 실사풍, 선화 등 여러 가지 스타일의 이미지를 생성할 수 있고요. 인물 이미지에서는 다양한 인종과 외모를 가진 인물을 생성하여 다양성 측면에도 중점을 두었다고 합니다. 현재, 스테이블 디퓨전 3.5 라지 및 터보는 허깅페이스에서 다운로드할 수 있으며, 추론 코드는 깃허브를 통해 사용할 수 있습니다.
[이벤트] 혹시 반복 업무나 비효율로 답답한가요?😣
모두의연구소가 제작 중인 업무 생산성 VOD 강의가 11월부터 순차적으로 공개됩니다🎉. 실무에 바로 적용할 수 있는 노션, 챗GPT, 피그마 등 핵심 툴 활용법부터 다채로운 생산성 향상 솔루션들이 준비되고 있어요. 지금 알림 신청하고 가장 먼저 소식을 받아보세요 🙂
● 참여 기간: 2024. 10. 17 – 2024. 11. 7
● 이벤트 혜택: 사전 알림 신청자 중 20명 추첨, 도서 <2025 AI 대전환: 주도권을 선점하라> 증정