
Компания MiniMax анонсировала новое поколение своей музыкальной платформы — Music 2.0. Это инструмент, который преобразует текстовые описания в полноценные песни с вокалом, аранжировкой и музыкальным сопровождением.
По словам представителя MiniMax, теперь искусственный интеллект способен создавать треки «профессионального качества» с реалистичным звучанием голоса и точной передачей эмоций. Postium выделил основные моменты.
Читайте также: Кто такие AI-креаторы?
Что умеет нейросеть MiniMax Music 2.0?
Music 2.0 позволяет пользователям просто ввести текстовую подсказку — например, «энергичная поп-песня о начале осени с женским вокалом» — и получить готовую композицию продолжительностью до нескольких минут.
Сервис генерирует:
- вокал, звучащий максимально «естественно» — с контролем тона, тембра и эмоций;
- инструментальные партии (гитара, барабаны, клавиши и др.);
- длительность до 5 минут;
- полную структуру песни — куплеты, припевы и переходы;
- аудиофайл высокого качества, готовый к использованию или доработке.
Музыку можно создавать в различных стилях — поп, джаз, рок, фолк, электронная, саундтрек и другие. Отдельно MiniMax акцентирует внимание на «гибкости вокала» (Versatile Vocals) и «точном контроле инструментов» (Precise Instrument Control).
Как создавать треки и песни в MiniMax Music 2.0?
Интерфейс Music 2.0 интегрирован в веб-приложение MiniMax в разделе Audio → Music.

Пользователь может:
- Ввести тему или концепцию песни в текстовое поле.
- Добавить собственный текст (Lyrics).
- Настроить параметры — жанр, настроение, количество треков.
- Нажать «Create» — через несколько минут появляется готовая песня.
Созданные треки хранятся во вкладке My Work, откуда их можно прослушать, скачать или доработать. Для доступа к расширенным функциям (например, больше треков или сложные инструменты) требуется подписка или кредиты внутри платформы.
Кроме веб-интерфейса Music 2.0 доступна через API. На момент релиза модель поддерживает английский язык и базовые вокальные стили.
Почему это важно? Запуск Music 2.0 продолжает серию значительных релизов MiniMax в октябре 2025 года. Неделей ранее компания представила Speech 2.6 — быструю и естественную модель озвучивания текста с откликом менее 250 мс. За день до этого появилась Hailuo 2.3 — нейросеть для генерации видео с реалистичными движениями и мимикой. А чуть раньше MiniMax представила MiniMax-M2 — открытую языковую модель на 230 млрд параметров для создания ИИ-агентов.
Таким образом, Music 2.0 завершает октябрьскую волну обновлений MiniMax, охватившую все ключевые направления — текст, речь, видео и музыку.
Ранее Cartesia выпустила нейросеть для синтеза речи Sonic-3.


