알리바바에서 그림이 노래를 부르는 비디오를 생성하는 모델인 EMO를 공개했습니다. EMO는 Stable Diffusion을 백본으로 두고 있고 음성, 얼굴 움직이는 속도등을 개선해 정교하게 움직이는 것이 특징입니다.
2024.03.04|이영빈