엔비디아의 혁신, 텍스트로 오디오를 창조하다: 생성형 AI 모델 푸가토(Fugatto)
엔비디아의 새로운 도전: 텍스트에서 오디오로엔비디아가 또 한 번 인공지능(AI) 기술의 경계를 넘어서며, 텍스트 기반으로 오디오 출력을 생성하고 제어할 수 있는 새로운 AI 모델 **푸가토(Fugatto)**를 발표했습니다. 이 모델은 노래 작곡, 음성 수정, 사운드 디자인 등 다양한 분야에서 강력한 기능을 제공하며, AI 연구와 오디오 제작의 새로운 패러다임을 제시합니다.1. 푸가토란 무엇인가?푸가토는 엔비디아 생성형 AI 연구팀이 개발한 파운데이션 생성형 트랜스포머 모델입니다. 기존의 음성 모델링, 오디오 보코딩(VoCoding), 오디오 이해 분야에서 축적된 연구를 기반으로 개발된 이 모델은 기존 AI 모델보다 훨씬 정교하고 창의적인 오디오 작업이 가능합니다.특히, 푸가토는 텍스트와 오디오 파일의 ..
2024.12.03