모두의 이야기 블로그

모두의연구소의 교육, 문화, 기술 등 다양한 이야기와 경험을 함께 나눕니다

AI뉴스

언어모델의 발전의 중심, attention – 모두연 AI 뉴스(241127)

다양한 LLM의 발전, 그 중심에는 attention 이 있습니다. 오늘 학계에서는 attention 기법을 개선하는 새로운 기술이 2개 소개되었습니다. 

박광석 | 2024.11.27

AI뉴스

다양한 이미지 생성 기법 – 모두연 AI 뉴스(241126)

오늘, 다양한 이미지 생성 기법이 발표되었습니다. 이 중 주목할만한 두 가지 기법을 소개해드립니다.

박광석 | 2024.11.27

AI뉴스

스테이블 디퓨전 의 컴포넌트 개량 – 모두연 AI 뉴스(241125)

스테이블 디퓨전 모델은 인코더, 디코더 외에도 디노이징에 관여하는 샘플러, 조건을 반영시키는 컨디셔닝 등 다양한 컴포넌트로 이루어져 있습니다.
이런 컴포넌트의 개량으로, 기존 모델은 뛰어난 향상을 보이기도 합니다.

박광석 | 2024.11.25

AI뉴스

AI 에이전트 의 다양한 활용 – 모두연 AI 뉴스(241122)

2025년 AI 트렌드 중 하나가 될 것으로 예측되는 AI 에이전트 ,
다양한 활용과 그 활용을 위한 프레임워크까지 활발히 연구가 진행되고 있습니다.
어제, 그리고 오늘 기업이 참가하여 진행한 AI 에이전트 관련 연구를 소개해드립니다.

박광석 | 2024.11.22

AI뉴스

보이스피싱 방지 AI , 휴머노이드 – 모두연 AI 뉴스(241121)

최근 많은 관심을 받고 있는 보이스피싱 방지 를 수행하는 AI 와 휴머노이드 로봇을 소개해드립니다.

박광석 | 2024.11.21

AI뉴스

의료 AI 의 발전 – 모두연 AI 뉴스(241120)

의료 AI 가 나날이 발전하고 있습니다.
기존에는 판독의 보조수단이었지만, 모델의 발전과 겹쳐 사람이 판독하지 못하는 미세한 지점까지 찾아서 정확한 결과를 보여준다던지, LLM으로 환자에게 필요한 행동지도를 하는 수준까지 발전하게 되었습니다.
오늘 발표된 의료 AI를 다루는 두 논문을 소개해드립니다.

박광석 | 2024.11.20

AI뉴스

VLM 이 한단계 진화했어요 – 모두연 AI 뉴스(241119)

이미지와 사용자의 텍스트 입력에 대해 복잡한 시각적 정보를 이해하고 답변하는 능력을 보여준 LLaVA 를 기점으로,
‘언어모델’ 이 ‘시각정보’를 ‘이해’ 하기 시작했다는 연구계의 시선과 함께 VISION LANGUAGE MODEL (이하 VLM ) 은 꾸준히 발전을 지속해왔는데요,
또 한번의 진화를 거듭한 VLM 이 어제와 오늘, 이틀에 걸쳐 등장했습니다.

박광석 | 2024.11.19

AI뉴스

Gaussian splatting 의 응용 – 모두연 AI 뉴스(241118)

2D 이미지를 3D 객체로 변환하는 연구는 꾸준히 인기있는 주제입니다. 한동안 물체를 찍은 여러 장의 이미지를 입력 받아 새로운 시점에서의 물체 이미지를 만들어내는(View synthesis) 모델인 NeRF가 대세로 굳어져가는 듯 했지만, Nerf에는 치명적인 단점이 있었습니다. 바로 학습속도와 렌더링 속도가 지나치게 느리기 때문에, 고품질의 결과물을 만들기 어렵거나, 실시간 디스플레이를 만들 수 없다는 것입니다. 이런 상황에서, SIGGRAPH 2023에서 발표된 […]

박광석 | 2024.11.18

AI뉴스

이미지 편집 AI 로 원하는 이미지 뚝딱 ! – 모두연 AI 뉴스(241115)

원하는데로 이미지를 컨트롤 할 수 있는 이미지 편집 AI , 얼마나 발전했을까요? 바로 오늘, 그리고 어제 발표된 논문을 통해 살펴봅니다.

박광석 | 2024.11.15

AI뉴스

사용자 상호작용 을 통해 객체를 다루는 비전 기반 모델들 – 모두연 AI 뉴스(241114)

객체를 의미론적으로 분할하거나 , 기존 이미지에 객체를 더하는 태스크는 활용도가 무궁무진하기 때문에 컴퓨터 비전에서 항상 인기있는 주제입니다. 사용자 상호작용 을 통해 편의성을 제공하면서 이와 같은 태스크를 수행하는 두 가지 모델을 소개해드립니다.

박광석 | 2024.11.14