HRS LAB
음성 분야에서 기본적으로 사용되는 단시간 푸리에 변환은 시간 해상도와 주파수 해상도를 동시에 높이지 못하는 한계를 가지고 있습니다. HRS(고해상도 스펙트로그램) Lab은 단시간 푸리에 변환의 해상도 한계를 해결한 고해상도 스펙트로그램 추출 방법을 이용하여 딥러닝 기반의 소음 제거, 음원 분리, 감성 검출, 화자인식, 음성인식 등의 분야에서 SOTA를 넘어서는 방법을 연구하고 구현하는 모임입니다.
모임요일
매주 수요일
모임시간
19:30
모임장소
강남캠퍼스
모집인원
10 명
모집방법
신청서제출 >> 랩짱 선발심사 진행
과정시작

2021년 12월 15일

가격
165,000원
연구목표
HRS Lab은 고해상도 스펙트로그램을 사용하여 노이즈 제거, 음원 분리 등 다양한 음성 분야에서 State-of-the-Art를 넘어서는 결과를 얻기 위한 방법들을 연구합니다. 이 과정에서 딥러닝 기반의 노이즈 제거, 음원 분리 등의 기존 방법을 학습하고 오픈 소스를 분석하고 수정 개발합니다.
#기술_개발   #커뮤니케이션을_위한_모임   
운영방식
1) 고해상도 스펙트로그램에 대해서 세미나를 진행하고
2) 노이즈 제거, 음원 분리, 감성 검출, 화자 인식 등 고해상도 스펙트로그램 적용 분야를 정하고
3) 각 연구원들이 관심을 갖는 주제를 맡아서
4) 기존 방법 논문 발표 및 오픈소스 리뷰 후
5) 고해상도 스펙트로그램 적용 방법을 정하고
6) 각 연구원별로 맡은 주제의 개발을 진행합니다.
참여조건
- 딥러닝과 음성 분야의 기본 지식이 있는 분
- Pytorch 등을 기반으로 딥러닝 기반의 오픈소스를 수정하여 알고리듬 구현이 가능하신 분
활동계획
주차 학습내용
1 주차 오리엔테이션 + 아이스브레이킹
2~3주차 관련 논문 리뷰
4~5주차 코드 리뷰 및 개발 방법 아이디어 발표
6~11주차 개발 및 결과 발표
랩짱소개
김동진
삼성전자, 네이버, 인공지능연구원 등을 거쳐서 브레인소프트를 창업하고 음성 분야 기술을 연구개발하고 있습니다. 음성 분야에서 수 십 년 이상 사용되고 있는 단시간 푸리에 변환으로는 정확한 정보를 얻는데 한계가 있어서 노이즈 제거, 음원 분리 등의 최근 연구들은 딥러닝으로 주파수에 상응하는 피처를 추출하는 방법들을 사용하고 있습니다. 이러한 피처 추출 대신에 원래의 주파수를 고해상도로 추출할 수 있으면 음성 관련 다양한 분야에서 크게 성능을 높일 수 있을 것으로 기대됩니다. 그래서 단시간 푸리에 변환을 고해상도 스펙트로그램 추출하는 자체 기술로 대체하여 음성 분야의 새로운 세계를 열고자 합니다. 같이 음성분야의 새로운 세계를 열어 봅시다.
소속 l 카이스트 물리학과 학사 / 카이스트 전산학 석사 / 카이스트 전산학 박사
E-mail l djkim@brainsoft.ai
김성표
소속 l 브레인소프트(주)
E-mail l sngpkim@brainsoft.ai
김정형
소속 l 브레인소프트(주)
E-mail l jhkim@brainsoft.ai