
Команда Wan из Китая (принадлежит Alibaba Cloud) представила обновлённую модель ИИ для видео — Wan 2.5. Теперь ролики создаются не только с изображением, но и со звуковым сопровождением: модель автоматически добавляет закадровый голос, музыку, эффекты и синхронизирует движения губ с текстом.
Поддерживается озвучка на нескольких языках, включая русский. Качество изображения и плавность анимации значительно улучшены по сравнению с версией 2.2. Postium собрал больше информации о новом ИИ-генераторе видео и предлагает узнать, как протестировать его бесплатно.
Читайте также: Промты для генерации видео
Что нового в Wan 2.5
Для пользователей новая версия генератора предоставляет возможность создавать видео «под ключ» прямо из текста (или изображения), без необходимости отдельного монтажа и наложения звука. Вот наглядный пример:
Возможности новой нейросети:
- Видео + звук в одном процессе. Генерация ролика и аудио происходит одновременно, без дополнительной обработки.
- Автоматическая синхронизация губ. Реплики персонажей адаптируются под движения губ.
- Языки. Поддерживается многоязычная озвучка: английский, китайский и другие, включая русский.
- Форматы. Видео до 1080p, доступны предустановки «быстрый рендер» и «максимальное качество».
- Режимы ввода. Text-to-video и image-to-video: можно ввести описание или загрузить изображение для создания ролика.
- Скорость. По отзывам тестировщиков, короткое видео длительностью 4–5 секунд генерируется за несколько минут.
Как пользоваться Wan 2.5 Video
Wan 2.5 уже доступен для тестирования на сайте сервиса, вход через Гугл-аккаунт, без ограничений. После входа на сайт переходим в генератор (в меню справа), вводим запрос и настраиваем параметры генерации: первый кадр, тип генерации, длина видео, модель, звук, камера и прочее:

Если вы генерируете видео бесплатно, без оплаты кредитами — придётся подождать результат, если оплачиваете — получите ролик быстрее.

Тариф Pro будет стоить $6,5 в месяц, на нём вы получите 300 кредитов и другие премиум-функции. Также можно приобрести дополнительно от 30 кредитов.

Также доступен вариант через API и сервисы-партнёры. Полностью бесплатного доступа нет, но платформы, такие как Higgsfield, ComfyUI, VEED и другие партнёры могут предоставлять бесплатные лимиты на генерацию (несколько роликов в день или ограничение по времени). Открытого кода разработчики пока не обещают.
Также возможно подключение API. Wan 2.5 представлен на маркетплейсах моделей, включая Replicate, где можно оплачивать использование по мере необходимости. Некоторые сервисы предоставляют тестовые кредиты.
Wan 2.5 выходит на рынок в момент, когда за внимание соревнуются Google Veo 3, Pika Labs, Runway и китайский конкурент Kling 2.5 Turbo. Однако ключевое отличие китайской модели заключается в акценте на создание полноценного мультимедийного клипа «из промпта». Если у конкурентов видео и звук обычно генерируются отдельно, здесь все объединено в одном процессе.
Кроме того, немного ранее был представлен модуль Wan 2.2 Animate, который позволяет анимировать персонажей и добавлять речь. Версия 2.5 стала логическим продолжением: объединить изображение и звук в одном инструменте, сделать технологию более доступной и экономичнее по сравнению с конкурентами.


