##llm
AudioAI LAB
모임 기간
2025.01.09 - 2025.02.12
모임 일시
매주 목요일 14:00 ~ 16:00
장 소
온라인
모집 기간
2024.12.24 - 2025.01.04
모집 인원
1명
선발 방식
사전 질문 기반 심사
랩 소개
운영 방식
참여 요건
랩장 소개
⭐️ 랩 소개
한 줄 소개
AudioLLM 연구를 계획하고 있습니다.
분야
ENGINEERING
목표 결과물
PAPER
연구 내용: Audio관련 LLM 연구 진행
목표: INTERSPEECH, ACL 2025 논문 제출
Audio data 처리와 LLM 분야에서 INTERSPEECH, ACL 2025를 목표로 연구를 진행할 계획입니다. LAB의 목표는 오디오 관련 LLM 연구를 통해 새로운 방법론을 개발하고, 이를 바탕으로 INTERSPEECH, ACL 2025에 논문을 제출하는 것입니다.
연구 내용은 주로 오디오 데이터를 기반으로 하는 자연어 처리와 LLM의 효율적인 학습 방법에 초점을 맞추고 있습니다. 최신 방법론(오디오 인식, 처리 및 생성 관련)을 통해 기존 text-only LLM에서의 문제를 오디오와 언어 간 통합적 이해를 바탕으로 해결하고자 하는 목표를 가지고 있습니다. 또 LLM의 발전으로 음성 챗봇형태의 agent의 발전에 맞추어 End-Turn Detection (발화자가 말을 끝냈는지 생각중인지 잘 맞추기)를 하는 연구를 진행하려고 하고 있습니다. 또 데이터의 singstyle을 captioning하는 모델 개발 진행 등을 계획하고 있습니다
아래는 4가지 Target 논문들의 주제입니다.
1. Imagination for Audio
2. End-turn Detection
3. Singstyle captioning
4. Song2Karaoke,
5. hypernetwork robust asr
⭐️ 운영 방식
매주 목요일 15시부터 17시까지 비대면 미팅
실험 결과 및 진행 사항 공유
1주차: 논문 탐색 및 baseline 선정
2주차: baseline 구현 및 결과 확인
3주차 :baseline 구현 및 결과 확인
4주차: 새로운 방법론 구체화 및 구현
5주차: 새로운 방법론 구체화 및 구현
6주차 이후: 방법론 실험 진행 및 수정
⭐️ 커리큘럼
1주차: 논문 탐색 및 baseline 선정
2주차: baseline 구현 및 결과 확인
3주차 :baseline 구현 및 결과 확인
4주차: 새로운 방법론 구체화 및 구현
5주차: 방법론 실험 진행 및 수정
6주차: 실험 및 논문 작성
7주차: 실험 정리 및 논문 작성 마무리
⭐️ 참여 요건
1. Top Conference 논문 작성 경험
2. LLM 관련 경험
3. Audio 관련 경험
⭐️ 사전 질문
이름을 적어주세요
메일 주소를 작성해주세요
자신을 소개하는 페이지 링크를 첨부해주세요(CV, Resume 등)
⭐️ 랩장 소개
유수호
인하대학교 · uso7d0@gmail.com
linkedin.com/in/uso7d0/