세계 최고의 오픈 생성 AI 기업인 Stability AI는 오늘 회사의 첫 번째 AI 제품인 Stable Audio를 출시했습니다. Stable Audio는 최신 생성 AI 기술을 사용하여 빠르고 고품질의 음악을 쉽게 생성할 수 있는 웹 인터페이스를 통해 제공됩니다. Stability AI는 기본 무료 버전의 Stable Audio와 함께 ‘Pro’ 구독도 제공하며, ‘Pro’ 구독은 상업용 프로젝트에 다운로드 가능한 90초 트랙을 제공합니다.
Stability AI의 CEO인 Emad Mostaque는 “독립적이고 오픈 및 다중 모달 생성 AI 기업으로서 음악 창작자를 지원하기 위해 우리의 전문 지식을 활용하여 제품을 개발하는 것에 대해 매우 기쁘게 생각합니다”라고 말했습니다. 그는 또한 “Stable Audio가 음악 애호가와 창의적 전문가들이 AI의 도움을 받아 새로운 콘텐츠를 생성하는 데 도움이 되기를 바라며 끊임없는 혁신을 기대하고 있습니다”라고 덧붙였습니다.
Stable Audio는 자신의 음악에 사용할 샘플을 만들고자 하는 음악가들에게 이상적이지만, 창작자들에게는 무한한 가능성이 있습니다. 음악 트랙은 사용자가 제공하는 설명적인 텍스트 프롬프트와 구성의 원하는 길이에 따라 생성됩니다. 예를 들어, “포스트 록, 기타, 드럼 킷, 베이스, 현악기, 유포릭, 감동적인, 울려 퍼지는, 원시적인, 화려한, 센치한, 125 BPM”와 같은 요청과 함께 95초 트랙을 요청하면 해당 트랙을 제공합니다. 이 기반 모델은 주요 음악 라이브러리인 AudioSparx에서 얻은 음악과 메타데이터를 사용하여 교류를 통해 경제적 및 창조적 가치를 창출하는 기업 간 파트너십을 통해 훈련되었습니다.
Stable Audio는 상용용도의 고품질 44.1 kHz 음악 생성을 위한 첫 번째 제품으로 잠재 확산(latent diffusion)을 이용합니다. 잠재 확산 아키텍처는 텍스트 메타데이터와 오디오 파일의 지속 시간 및 시작 시간에 맞춰진 오디오를 사용하여 생성된 오디오의 내용과 길이를 조절할 수 있게 합니다.