Stacked Hourglass Networks : pose estimation 논문
pose estimation이란 사람의 인체 부위를 각 찾아내서 인체의 움직임을 표현하는 task입니다. 과거에는 효율성과 정확성의 한계로 인해 거의 사용되지 않았으나, 딥러닝의 도입으로 관련 산업이 크게 발전하고 있습니다.
신유진 | 2024.07.12
pose estimation이란 사람의 인체 부위를 각 찾아내서 인체의 움직임을 표현하는 task입니다. 과거에는 효율성과 정확성의 한계로 인해 거의 사용되지 않았으나, 딥러닝의 도입으로 관련 산업이 크게 발전하고 있습니다.
신유진 | 2024.07.12
이틀 전, VISION LANGUAGE MODEL IS BLIND 라는 논문이 등장하며 연구 커뮤니티에서 큰 화제가 되었습니다. 세상을 시각적으로 인식하는 AI 모델의 앞날은 어떻게 될까요? 인공지능 모델의 큰 변혁, Deep Impact가 다가오게 될까요?
박광석 | 2024.07.12
Ablation Study는 모델의 성능에 가장 큰 영향을 미치는 요소를 찾기 위해 모델의 구성요소 및 feature들을 단계적으로 제거 하거나 변경해가며 성능의 변화를 관찰하는 방법이며 모델의 핵심적인 구성요소와 하이퍼파라미터등을 파악할 수 있습니다.
신유진 | 2024.07.11
Neural Architecture Search(NAS)란? Neural Architecture Search with Reinforcement Learning이라는 논문은 Google Brain(구글 브레인)에서 2016년에 발표한 논문으로 기본적인 아이디어는 적합한 신경망 구조를 예측하는 신경망을 자동적으로 만들어서, 기존에는 인간의 지식에 의해 설계되던 신경망 구조를 자동화된 방법으로 찾아내는 것입니다. Auto ML을 제시 이는 AutoML이라는 새로운 연구방향을 제시한 선구적인 논문으로, 본 논문에는 좋은 아키텍쳐들을 자동적으로 찾기 위해 gradient-based […]
신유진 | 2024.07.11
Spatial Transformer Network 는 이미지 분류를 할 때, 특정 부분을 선택해 집중적으로 학습시키는 방법을 사용합니다. 이는 이미지를 변환해도 동일한 이미지로 인식하는 능력인 공간 불변성을 향상시키기 위한 것입니다.
신유진 | 2024.07.11
어텐션 (attention)은 딥러닝 커뮤니티에서 가장 두드러진 아이디어 중 하나입니다. 이미지 캡션 생성과 같은 다양한 문제에 사용되고 있습니다. 하지만 원래는 Seq2Seq 모델을 사용한 신경망 기계 번역의 맥락에서 설계되었습니다.
김성진 | 2024.07.11
대화형 AI 생성 모델에게서 더 좋은 답을 얻을 수 있는 Prompt Engineering 기법을 소개합니다
박광석 | 2024.07.10
GLUE 벤치마크는 “강건하고 범용적인 자연어 이해 시스템의 개발” 이라는 목표로 만들어진 데이터셋입니다. GLUE는 자연어 처리 모델을 훈련시키고 그 성능을 평가 및 비교 분석하기 위한 데이터셋들로 구성되어 있습니다.
신유진 | 2024.07.10
이미지 처리에서 다뤘던 데이터 preprocessing 할 때 활용할 수 있는 다양한 augmentation 방법에 대해 간단히 다룹니다. 데이터 증강은 이미지 처리 분야에서 학습했듯이, 데이터셋을 확장하여 모델의 성능을 개선하는 기술입니다.
신유진 | 2024.07.10
인간의 피드백을 받은 강화학습 으로 언어모델을 훈련 및 보상하는 과정에 대해 소개합니다. RLHF와 같은 다양한 기법들이 현재 LLM 트렌드에 적합하며 특히 채팅시스템에서 유용하게 사용되고 있습니다.
신유진 | 2024.07.09