Falcon Mamba 7B : 맘바 아키텍처를 응용한 새로운 언어 모델 [모두레터]
오픈소스 언어 모델 팰컨(Falcon)을 개발한 연구 기관 TII가 발표한 새로운 언어 모델 ‘팰컨 맘바 7B(Falcon Mamba 7B)’에 대해 알아봅시다.
하자혜 | 2024.08.19
오픈소스 언어 모델 팰컨(Falcon)을 개발한 연구 기관 TII가 발표한 새로운 언어 모델 ‘팰컨 맘바 7B(Falcon Mamba 7B)’에 대해 알아봅시다.
하자혜 | 2024.08.19
올해 다양한 소형언어모델(SLM)이 공개된 가운데 openAI도 GPT4o-mini를 공개하면서 대열에 합류했습니다. SLM은 왜 이렇게 주목받게 된 걸까요?
차정은 | 2024.07.30
SIMD는 Single Instruction Multiple Data의 줄임말로, 하나의 명령어로 여러개의 데이터를 한번에 처리하는 병렬화하는 프로그래밍 방법을 소개합니다. SIMD는 동영상 렌더링 처리와 같이 대용량데이터처리에 효과적입니다.
신유진 | 2024.07.12
pose estimation이란 사람의 인체 부위를 각 찾아내서 인체의 움직임을 표현하는 task입니다. 과거에는 효율성과 정확성의 한계로 인해 거의 사용되지 않았으나, 딥러닝의 도입으로 관련 산업이 크게 발전하고 있습니다.
신유진 | 2024.07.12
Ablation Study는 모델의 성능에 가장 큰 영향을 미치는 요소를 찾기 위해 모델의 구성요소 및 feature들을 단계적으로 제거 하거나 변경해가며 성능의 변화를 관찰하는 방법이며 모델의 핵심적인 구성요소와 하이퍼파라미터등을 파악할 수 있습니다.
신유진 | 2024.07.11
Neural Architecture Search(NAS)란? Neural Architecture Search with Reinforcement Learning이라는 논문은 Google Brain(구글 브레인)에서 2016년에 발표한 논문으로 기본적인 아이디어는 적합한 신경망 구조를 예측하는 신경망을 자동적으로 만들어서, 기존에는 인간의 지식에 의해 설계되던 신경망 구조를 자동화된 방법으로 찾아내는 것입니다. Auto ML을 제시 이는 AutoML이라는 새로운 연구방향을 제시한 선구적인 논문으로, 본 논문에는 좋은 아키텍쳐들을 자동적으로 찾기 위해 gradient-based […]
신유진 | 2024.07.11
Spatial Transformer Network 는 이미지 분류를 할 때, 특정 부분을 선택해 집중적으로 학습시키는 방법을 사용합니다. 이는 이미지를 변환해도 동일한 이미지로 인식하는 능력인 공간 불변성을 향상시키기 위한 것입니다.
신유진 | 2024.07.11
어텐션 (attention)은 딥러닝 커뮤니티에서 가장 두드러진 아이디어 중 하나입니다. 이미지 캡션 생성과 같은 다양한 문제에 사용되고 있습니다. 하지만 원래는 Seq2Seq 모델을 사용한 신경망 기계 번역의 맥락에서 설계되었습니다.
김성진 | 2024.07.11
GLUE 벤치마크는 “강건하고 범용적인 자연어 이해 시스템의 개발” 이라는 목표로 만들어진 데이터셋입니다. GLUE는 자연어 처리 모델을 훈련시키고 그 성능을 평가 및 비교 분석하기 위한 데이터셋들로 구성되어 있습니다.
신유진 | 2024.07.10
이미지 처리에서 다뤘던 데이터 preprocessing 할 때 활용할 수 있는 다양한 augmentation 방법에 대해 간단히 다룹니다. 데이터 증강은 이미지 처리 분야에서 학습했듯이, 데이터셋을 확장하여 모델의 성능을 개선하는 기술입니다.
신유진 | 2024.07.10