
Stability AI анонсировала «Stable Audio 2.5» — новую модель для генерации музыкальных произведений. Она способна создавать треки продолжительностью до 3 минут всего за несколько секунд, сохраняет структуру (интро, развитие, аутро), четко разделяет инструменты и более эффективно справляется с различными жанрами и их сочетаниями. Попробовать новинку можно прямо на сайте StableAudio.
Теперь бренды, студии и авторы могут за считанные минуты создавать фоновые композиции, джинглы или полные треки без участия музыкантов. Postium собрал основные моменты.
Читайте также: 5 нейросетей для создания музыки
Stable Audio 2.5 — возможности и инструкции по использованию
Ключевой момент — коммерческое применение: у Stability AI уже установлено партнерство с агентством amp (WPP) для разработки кастомизированных решений.
Основные обновления:
- Скорость. Генерация трека до 3 минут занимает всего несколько секунд.
- Музыкальная структура. Композиции звучат «живее» — с полноценными частями, а не только с зацикленным фрагментом.
- Увеличенный контроль. В дополнение к text-to-audio и audio-to-audio появилась функция аудио-инпейнтинга: можно загрузить фрагмент трека, выбрать начальную точку, и модель продолжит его.
- Защита авторских прав. Система проверяет, чтобы пользователь не загружал защищенные треки других авторов.
- Где использовать. StableAudio.com, API Stability AI, а также через fal, Replicate и ComfyUI.
Инструкция по использованию Stable Audio 2.5:
- Перейдите на сайт stableaudio.com.
- Выберите режим генерации:
– Text-to-audio — введите подсказку: жанр, настроение, инструменты.
– Audio-to-audio — загрузите свой отрывок, нейросеть его изменит или доработает.
– Inpainting — обрежьте или выберите фрагмент, а модель продолжит композицию. - Настройте длину — до 3 минут.
- Скачайте результат. Бесплатно можно сгенерировать до 10 треков в месяц (с ограничением до 30 секунд для скачивания). Для коммерческого использования необходим платный тариф.
В апреле 2024 года была выпущена Stable Audio 2.0: впервые появилась возможность создания треков до 3 минут и режим audio-to-audio. В 2025 году компания запустила открытые версии для разработчиков и мобильных устройств — «Stable Audio Open Small». Это сделало генерацию звука более доступной и быстрой.
Stable Audio 2.5 уже доступна для всех — в интернете, через API и на партнерских платформах. Бесплатный тариф предоставляет 10 генераций в месяц для личного пользования, коммерческое использование — только по платной подписке или корпоративной лицензии.
Ранее Replit представил Agent 3 — автономного ИИ-агента, который научился собирать приложения и Телеграм-ботов.


