2025 AI Trend 시리즈 – 2. AI Agent
사람을 대신해 미션을 해결해주거나 주요 과업을 자동화하여 돕는 AI. 사용자와의 의사소통을 통해 의도를 정확히 파악하고 원하는 결과를 만들어냅니다. 특히 2024년에 들어 폭발적으로 관련 연구가 늘어났던 AI agent , 그 정의와 연구 동향을 살펴봅니다.
박광석 | 2024.11.22
사람을 대신해 미션을 해결해주거나 주요 과업을 자동화하여 돕는 AI. 사용자와의 의사소통을 통해 의도를 정확히 파악하고 원하는 결과를 만들어냅니다. 특히 2024년에 들어 폭발적으로 관련 연구가 늘어났던 AI agent , 그 정의와 연구 동향을 살펴봅니다.
박광석 | 2024.11.22
2025년 AI 트렌드 중 하나가 될 것으로 예측되는 AI 에이전트 ,
다양한 활용과 그 활용을 위한 프레임워크까지 활발히 연구가 진행되고 있습니다.
어제, 그리고 오늘 기업이 참가하여 진행한 AI 에이전트 관련 연구를 소개해드립니다.
박광석 | 2024.11.22
차원의 저주 (Curse of Dimensionality)는 고차원 공간(종종 수백 또는 수천 차원)에서 데이터를 분석하고 조직할 때 발생하는 다양한 문제와 복잡성을 나타냅니다. 머 신 러닝의 영역에서 이 개념을 이해하는 것은 매우 중요합니다. 데이터 세트의 특징 또는 차원의 수가 증가함에 따라 정확하게 일반화하는 데 필요한 데이터 양이 기하급수적으로 증가하기 때문입니다. 수학자 Richard E. Bellman이 만든 ‘차원의 저주’라는 용어는 […]
김성진 | 2024.11.21
최근 많은 관심을 받고 있는 보이스피싱 방지 를 수행하는 AI 와 휴머노이드 로봇을 소개해드립니다.
박광석 | 2024.11.21
의료 AI 가 나날이 발전하고 있습니다.
기존에는 판독의 보조수단이었지만, 모델의 발전과 겹쳐 사람이 판독하지 못하는 미세한 지점까지 찾아서 정확한 결과를 보여준다던지, LLM으로 환자에게 필요한 행동지도를 하는 수준까지 발전하게 되었습니다.
오늘 발표된 의료 AI를 다루는 두 논문을 소개해드립니다.
박광석 | 2024.11.20
이미지와 사용자의 텍스트 입력에 대해 복잡한 시각적 정보를 이해하고 답변하는 능력을 보여준 LLaVA 를 기점으로,
‘언어모델’ 이 ‘시각정보’를 ‘이해’ 하기 시작했다는 연구계의 시선과 함께 VISION LANGUAGE MODEL (이하 VLM ) 은 꾸준히 발전을 지속해왔는데요,
또 한번의 진화를 거듭한 VLM 이 어제와 오늘, 이틀에 걸쳐 등장했습니다.
박광석 | 2024.11.19
2D 이미지를 3D 객체로 변환하는 연구는 꾸준히 인기있는 주제입니다. 한동안 물체를 찍은 여러 장의 이미지를 입력 받아 새로운 시점에서의 물체 이미지를 만들어내는(View synthesis) 모델인 NeRF가 대세로 굳어져가는 듯 했지만, Nerf에는 치명적인 단점이 있었습니다. 바로 학습속도와 렌더링 속도가 지나치게 느리기 때문에, 고품질의 결과물을 만들기 어렵거나, 실시간 디스플레이를 만들 수 없다는 것입니다. 이런 상황에서, SIGGRAPH 2023에서 발표된 […]
박광석 | 2024.11.18
글 뿐만 아니라 음성, 사진, 영상을 입력으로 받아 다양한 형태의 콘텐츠나 데이터를 생성할 수 있는 Multimodal AI.
강력한 성능과 활용성에, 2025 AI trend 중 하나가 될 것으로 예측되고 있습니다.
박광석 | 2024.11.15
원하는데로 이미지를 컨트롤 할 수 있는 이미지 편집 AI , 얼마나 발전했을까요? 바로 오늘, 그리고 어제 발표된 논문을 통해 살펴봅니다.
박광석 | 2024.11.15
객체를 의미론적으로 분할하거나 , 기존 이미지에 객체를 더하는 태스크는 활용도가 무궁무진하기 때문에 컴퓨터 비전에서 항상 인기있는 주제입니다. 사용자 상호작용 을 통해 편의성을 제공하면서 이와 같은 태스크를 수행하는 두 가지 모델을 소개해드립니다.
박광석 | 2024.11.14