Human 피드백을 통한 언어 모델 강화학습하기
인간의 피드백을 받은 강화학습 으로 언어모델을 훈련 및 보상하는 과정에 대해 소개합니다. RLHF와 같은 다양한 기법들이 현재 LLM 트렌드에 적합하며 특히 채팅시스템에서 유용하게 사용되고 있습니다.
신유진 | 2024.07.09
인간의 피드백을 받은 강화학습 으로 언어모델을 훈련 및 보상하는 과정에 대해 소개합니다. RLHF와 같은 다양한 기법들이 현재 LLM 트렌드에 적합하며 특히 채팅시스템에서 유용하게 사용되고 있습니다.
신유진 | 2024.07.09
Amazon SageMaker 를 활용하여 훈련을 하고 엔드포인트로 저장하는 절차를 소개합니다.
신유진 | 2024.07.08
이 글에서는 BERT 임베딩 레이어 구현 세부 사항에 대해 설명할 것입니다. 구체적으로는 토큰 임베딩, 세그먼트 임베딩, 그리고 위치 임베딩(Position Embeddings)에 대해 다룰 것입니다.
신유진 | 2024.07.08
Ray 를 활용해 파이썬 병렬화하는 방법을 소개합니다. Ray를 활용하면 Numerical Data를 효율적으로 처리할 수 있고상태를 유지하는 계산에 대한 추상화가 가능해지기 때문에 매우 유용한 툴입니다.
신유진 | 2024.07.02
결정계수 R-squared에 대한 설명입니다.결정력 이라고도 불리는 결정계수는 회귀분석의 성능 평가 척도 중 하나로 다음과 같은 특징을 갖고 있으며 머신러닝에서 대양한 환경에서 사용이 되고 있습니다.
신유진 | 2024.06.28
Meena – 기존 챗봇 및 대화형 AI 시스템과는 다른 목표를 가지고 2020년도에 개발된 구글의 챗봇을 소개합니다. 보다 자연스러운 오픈 도메인 대화를 목표로 하며 다양한 주제에 대해 의미있고 구체적인 응답을 제공할 수 있는 능력을 갖추고 있습니다.
신유진 | 2024.06.28
컴퓨터 비전 분야는 기존의 통계적 방법에서 딥러닝 신경망 방법으로 전환되고 있습니다. 비록 여전히 해결해야 할 많은 도전 과제가 존재하지만, 딥러닝 방법은 특정 문제에서 최첨단 결과를 달성하고 있습니다.
김성진 | 2024.06.28
더미 변수(Dummy Variable) 는 범주형 데이터를 수치형 데이터로 변환하여 통계 분석 및 머신러닝 모델에 사용할 수 있게 하는 변수입니다. 더미 변수는 이진 변수로, 값이 0과 1로 할당되어 특정 범주에 속하는지를 나타냅니다.
김성진 | 2024.06.28
완전 합성곱 네트워크 (Fully Convolutional Networks, FCN) 은 계층적 특징을 생성하는 기존 합성곱 네트워크를 개선한 모델입니다.
완전 합성곱 네트워크가 단독으로 학습되어, 픽셀 단위로 최첨단 의미론적 세분화 성능을 높입니다. 임의 크기의 입력을 받아 효율적인 추론 및 학습으로 대응하는 크기의 출력을 생성하는 “완전 합성곱” 네트워크를 구축합니다.
김성진 | 2024.06.26
네트워크 인 네트워크 (Network In Network, NIN) 라는 새로운 깊은 네트워크 구조를 제안합니다. 이 구조는 수용 영역 (receptive field) 내의 로컬 패치 (local patch) 에 대한 모델의 판별력을 향상시키기 위해 고안되었습니다.
김성진 | 2024.06.24