모두의 이야기 블로그

모두의연구소의 교육, 문화, 기술 등 다양한 이야기와 경험을 함께 나눕니다

인공지능

Falcon Mamba 7B : 맘바 아키텍처를 응용한 새로운 언어 모델 [모두레터]

오픈소스 언어 모델 팰컨(Falcon)을 개발한 연구 기관 TII가 발표한 새로운 언어 모델 ‘팰컨 맘바 7B(Falcon Mamba 7B)’에 대해 알아봅시다.

하자혜 | 2024.08.19

인공지능

SLM의 시대가 찾아왔어-openAI의 GPT-4o-mini 공개

올해 다양한 소형언어모델(SLM)이 공개된 가운데 openAI도 GPT4o-mini를 공개하면서 대열에 합류했습니다. SLM은 왜 이렇게 주목받게 된 걸까요?

차정은 | 2024.07.30

인공지능

SIMD 병렬 프로그래밍

SIMD는 Single Instruction Multiple Data의 줄임말로, 하나의 명령어로 여러개의 데이터를 한번에 처리하는 병렬화하는 프로그래밍 방법을 소개합니다. SIMD는 동영상 렌더링 처리와 같이 대용량데이터처리에 효과적입니다.

신유진 | 2024.07.12

인공지능

Stacked Hourglass Networks : pose estimation 논문

pose estimation이란 사람의 인체 부위를 각 찾아내서 인체의 움직임을 표현하는 task입니다. 과거에는 효율성과 정확성의 한계로 인해 거의 사용되지 않았으나, 딥러닝의 도입으로 관련 산업이 크게 발전하고 있습니다.

신유진 | 2024.07.12

인공지능

Ablation Study 란?

Ablation Study는 모델의 성능에 가장 큰 영향을 미치는 요소를 찾기 위해 모델의 구성요소 및 feature들을 단계적으로 제거 하거나 변경해가며 성능의 변화를 관찰하는 방법이며 모델의 핵심적인 구성요소와 하이퍼파라미터등을 파악할 수 있습니다.

신유진 | 2024.07.11

인공지능

논문리뷰 – Neural Architecture Search with Reinforcement Learning

Neural Architecture Search(NAS)란? Neural Architecture Search with Reinforcement Learning이라는 논문은 Google Brain(구글 브레인)에서 2016년에 발표한 논문으로 기본적인 아이디어는 적합한 신경망 구조를 예측하는 신경망을 자동적으로 만들어서, 기존에는 인간의 지식에 의해 설계되던 신경망 구조를 자동화된 방법으로 찾아내는 것입니다.   Auto ML을 제시 이는 AutoML이라는 새로운 연구방향을 제시한 선구적인 논문으로, 본 논문에는 좋은 아키텍쳐들을 자동적으로 찾기 위해 gradient-based […]

신유진 | 2024.07.11

인공지능

Spatial Transformation Network란?

Spatial Transformer Network 는 이미지 분류를 할 때, 특정 부분을 선택해 집중적으로 학습시키는 방법을 사용합니다. 이는 이미지를 변환해도 동일한 이미지로 인식하는 능력인 공간 불변성을 향상시키기 위한 것입니다.

신유진 | 2024.07.11

인공지능

어텐션 (Attention)

어텐션 (attention)은 딥러닝 커뮤니티에서 가장 두드러진 아이디어 중 하나입니다. 이미지 캡션 생성과 같은 다양한 문제에 사용되고 있습니다. 하지만 원래는 Seq2Seq 모델을 사용한 신경망 기계 번역의 맥락에서 설계되었습니다.

김성진 | 2024.07.11

인공지능

GLUE: 벤치마크를 통해 BERT 이해하기

GLUE 벤치마크는 “강건하고 범용적인 자연어 이해 시스템의 개발” 이라는 목표로 만들어진 데이터셋입니다. GLUE는 자연어 처리 모델을 훈련시키고 그 성능을 평가 및 비교 분석하기 위한 데이터셋들로 구성되어 있습니다.

신유진 | 2024.07.10

인공지능

데이터 Preprocessing과 Augmentation

이미지 처리에서 다뤘던 데이터 preprocessing 할 때 활용할 수 있는 다양한 augmentation 방법에 대해 간단히 다룹니다. 데이터 증강은 이미지 처리 분야에서 학습했듯이, 데이터셋을 확장하여 모델의 성능을 개선하는 기술입니다.

신유진 | 2024.07.10