CAT3D와 VAR이 가져올 이미지 생성의 미래 – 모두연 AI 뉴스(241203)
인공지능 기술의 발전으로 이미지 생성과 3D 모델링 분야가 급속도로 성장하고 있습니다.특히 최근에는 더 적은 리소스로 더 나은 결과물을 만들어내는 혁신적인 기술들이 등장하고 있습니다. 이 혁신적인 기술들은 향후 게임 개발과 같은 분야에서 활용될 것입니다.
이영빈 | 2024.12.03
인공지능 기술의 발전으로 이미지 생성과 3D 모델링 분야가 급속도로 성장하고 있습니다.특히 최근에는 더 적은 리소스로 더 나은 결과물을 만들어내는 혁신적인 기술들이 등장하고 있습니다. 이 혁신적인 기술들은 향후 게임 개발과 같은 분야에서 활용될 것입니다.
이영빈 | 2024.12.03
인공지능(AI)이 의료 및 문제 해결 분야에서 혁신적인 진전을 이루고 있습니다.특히 최근 주목받고 있는 MDAgent와 DeAR은 대규모 언어 모델(LLM)을 활용하여 기존의 한계를 뛰어넘는 획기적인 성과를 보여주고 있습니다.
이영빈 | 2024.12.02
다양한 LLM의 발전, 그 중심에는 attention 이 있습니다. 오늘 학계에서는 attention 기법을 개선하는 새로운 기술이 2개 소개되었습니다.
박광석 | 2024.11.27
오늘, 다양한 이미지 생성 기법이 발표되었습니다. 이 중 주목할만한 두 가지 기법을 소개해드립니다.
박광석 | 2024.11.27
스테이블 디퓨전 모델은 인코더, 디코더 외에도 디노이징에 관여하는 샘플러, 조건을 반영시키는 컨디셔닝 등 다양한 컴포넌트로 이루어져 있습니다.
이런 컴포넌트의 개량으로, 기존 모델은 뛰어난 향상을 보이기도 합니다.
박광석 | 2024.11.25
2025년 AI 트렌드 중 하나가 될 것으로 예측되는 AI 에이전트 ,
다양한 활용과 그 활용을 위한 프레임워크까지 활발히 연구가 진행되고 있습니다.
어제, 그리고 오늘 기업이 참가하여 진행한 AI 에이전트 관련 연구를 소개해드립니다.
박광석 | 2024.11.22
최근 많은 관심을 받고 있는 보이스피싱 방지 를 수행하는 AI 와 휴머노이드 로봇을 소개해드립니다.
박광석 | 2024.11.21
의료 AI 가 나날이 발전하고 있습니다.
기존에는 판독의 보조수단이었지만, 모델의 발전과 겹쳐 사람이 판독하지 못하는 미세한 지점까지 찾아서 정확한 결과를 보여준다던지, LLM으로 환자에게 필요한 행동지도를 하는 수준까지 발전하게 되었습니다.
오늘 발표된 의료 AI를 다루는 두 논문을 소개해드립니다.
박광석 | 2024.11.20
이미지와 사용자의 텍스트 입력에 대해 복잡한 시각적 정보를 이해하고 답변하는 능력을 보여준 LLaVA 를 기점으로,
‘언어모델’ 이 ‘시각정보’를 ‘이해’ 하기 시작했다는 연구계의 시선과 함께 VISION LANGUAGE MODEL (이하 VLM ) 은 꾸준히 발전을 지속해왔는데요,
또 한번의 진화를 거듭한 VLM 이 어제와 오늘, 이틀에 걸쳐 등장했습니다.
박광석 | 2024.11.19
2D 이미지를 3D 객체로 변환하는 연구는 꾸준히 인기있는 주제입니다. 한동안 물체를 찍은 여러 장의 이미지를 입력 받아 새로운 시점에서의 물체 이미지를 만들어내는(View synthesis) 모델인 NeRF가 대세로 굳어져가는 듯 했지만, Nerf에는 치명적인 단점이 있었습니다. 바로 학습속도와 렌더링 속도가 지나치게 느리기 때문에, 고품질의 결과물을 만들기 어렵거나, 실시간 디스플레이를 만들 수 없다는 것입니다. 이런 상황에서, SIGGRAPH 2023에서 발표된 […]
박광석 | 2024.11.18