모두의연구소의 교육, 문화, 기술 등 다양한 이야기와 경험을 함께 나눕니다
AI가 우리 삶에 더욱 깊숙이 들어오고 있습니다. OpenAI와 휴머노이드 로봇 스타트업 피규어가 협력하여 만든 ‘figure01’ 로봇이 최근 공개되면서 전 세계에 충격파를 몰고 왔습니다.
AI로 작성한 논문이 잘 못 통과되었다면 어떻게 될까요? AI 챗봇이 틀린 답변은 한다면 책임은 누구에게 있을까요? 최근 주목받는 AI 윤리 관련 세미나와 발표를 중심으로 흥미로운 사례를 소개합니다.
Loss 와 metric 의 경향성을 통해 딥러닝의 학습 상태를 가늠해봅니다. 최적화 작업은 비정형적인 다양한 요소들이 참여하는 과정이기때문에, 학습 상태를 다각적으로 관찰하는 것이 중요합니다. 유형 별 사례과 현재 나의 상황을 비교해볼 수 있습니다.
GPT-4보다 더 좋은 모델인 Claude 3.0이 공개되었습니다. Claude 3.0은 Opus, Sonnet, Haiku라는 3가지 모델로 이루어져있으며 각 모델은 성능뿐만 아니라 자체적인 윤리성도 검증했다고 합니다!
다양한 머신러닝 알고리즘을 소개하고, 적절한 상황에 맞게 사용하는 팁을 제안합니다.
이번 블로그에서는 모델이 훈련할 때 오버피팅이 일어나는지 알기 위해 에러 분석을 진행하고 여기에서 발생하는 bias를 줄이기 위해 정칙화가 어떤 효과가 있으며 정칙화의 종류가 어떤 것이 있으며 각 정칙화간의 차이점을 분석할 예정입니다.
이상치 탐지(Anomaly Detection)는 데이터 세트에서 예상되는 패턴과는 다른 특이한 데이터 포인트를 찾는 기술입니다. 이상치는 데이터 세트의 다른 관측치들과는 매우 다른 특징을 가지고 있어서 주의를 불러일으키는 경우가 많습니다.
이미지 유사성 측정 방법으로 MSE, PSNR, SSIM을 소개합니다. MSE는 픽셀 색상의 정확도에 초점을 맞추고, PSNR은 최대 신호 대 잡음비로 이미지 품질을 평가합니다.
Vision Language Model이 커머스에서 어떻게 활용되고 있는지 네이버 쇼핑의 인공지능 사례를 통해 알아봅니다.
부트스트랩은 왜 통계, 머신러닝에서 복원추출하여 여러 데이터셋을 만드는 과정을 의미할까요? 부트스트랩의 의미를 스스로 찾아보고 이해해봅시다.
알리바바에서 그림이 노래를 부르는 비디오를 생성하는 모델인 EMO를 공개했습니다. EMO는 Stable Diffusion을 백본으로 두고 있고 음성, 얼굴 움직이는 속도등을 개선해 정교하게 움직이는 것이 특징입니다.
가짜 뉴스의 형태와 현황, 대처법에 대해 한국전자통신연구원의 고우영 연사님이 모두의연구소에서 AI 기반 가짜 뉴스와 허위 저작 정보 : 생성, 탐지 및 팩트 체크 기술을 주제로 모두팝 세미나를 진행해주셨습니다!
의료 영상에서 비어있는 정보를 인버스 문제로 채우고 문제의 영역을 생성형 AI 모델로 채워나가는 방법에 대해 이야기 해봅니다.
한국어 언어모델의 개발 과정을 자세히 들려드립니다. 토크나이져, TPU 학습 환경 세팅, 배포와 라이선스 까지 전체 과정을 통해 LLM의 효율적인 개발 방법에 대한 인사이트를 얻으실 수 있습니다.
AI가 본격적으로 서비스화되는 동시에 AI 보안 이슈도 제기되고 있습니다. 그렇기에 많은 회사들이 AI 보안문제를 해결하기 위해 노력하고 있지만 아직 뚜렷한 해결책이 나오지 않고 있습니다. 현재까지 나온 AI 보안 관련 방법론에 대해서 고찰했습니다.
쉽고 빠르게 익히는 실전 LLM은 LLM을 연구하는 사람들에게도 잘 맞으면서 비전공자이지만 현업에서 AI를 도입해서 자동화시키고 싶은 직장인들에게 딱 알맞는 책이라 생각합니다. 다양한 예제를 다룰 뿐만 아니라 비용까지 계산해서 다룹니다.
OpenAI가 공개한 비디오 생성 AI모델 Sora에 대해 알려드립니다. 텍스트 프롬프트를 통해 최대 1분 길이의 비디오를 생성할 수 있는 AI 모델 Sora를 통해 AGI 시대에 무엇이 필요할지 함께 고민해봅니다.
AI가 그림을 기똥차게 잘 그려준다고? 챗GPT, 달리2, 미드저니 등 최신 AI 창작 도구들을 체험해 봤어요! – 하자혜