Alibaba обновила свою генеративную модель до версии WAN 2.6. Нейросеть способна создавать видеоролики в разрешении 1080p продолжительностью до 15 секунд и работает с текстом, изображениями и референсными видео.
Доступ к WAN 2.6 уже открыт на официальном сайте Wan и в разработческих плейграундах, хотя официальный релиз запланирован на завтра. Новым пользователям предоставляют 150 кредитов — этого достаточно для пяти генераций 15-секундного видео.
Читайте также: 5 лучших нейросетей для генерации видео
Нейросеть WAN 2.6 — что нового и что она умеет
WAN 2.6 — мультимодальная видеомодель, предназначенная для создания коротких, но завершённых сцен. Она может генерировать видео на основе текстового описания, изображения и референсных видео, сохраняя персонажей и визуальный стиль между кадрами.
В режиме reference-to-video можно загрузить до трёх референсных роликов. Это необходимо для того, чтобы персонажи, объекты и окружение оставались неизменными от сцены к сцене и выглядели стабильно на протяжении всего видео.
Модель также умеет автоматически разделять результат на несколько планов и собирать их в готовый монтаж. В итоге получается не один длинный кадр, а полноценная сцена с логикой переходов.
Кроме того, WAN 2.6 меньше «плывёт» между кадрами и лучше удерживает персонажей, что ранее было её слабой стороной.
Отдельный блок — работа со звуком. В модель можно загрузить собственное аудио, при этом обещана точная синхронизация речи и улучшенный лип-синк. Речь идёт не просто о совпадении по таймингу, а о более корректной артикуляции.
Также теперь WAN 2.6 — это не только генерация видео. Модель поддерживает генерацию и редактирование изображений и работает с текстом внутри картинок — заголовками, надписями, интерфейсами и постерами.
Как пользоваться WAN 2.6 и создавать видео
Попробовать WAN 2.6 можно на официальном сайте Wan и в сторонних плейграундах. После входа необходимо перейти в раздел Generate, выбрать модель WAN 2.6 и режим генерации — по тексту, изображению или референсному видео.

Затем пользователь задаёт промт, выбирает формат видео, продолжительность, разрешение и дополнительные параметры. При необходимости можно загрузить аудио для синхронизации речи или референсные ролики, чтобы зафиксировать персонажей и стиль сцены. После запуска модель автоматически создаёт готовый ролик.
Генерация одного видео длительностью 15 секунд стоит 30 кредитов. Всем пользователям в настоящее время предоставляют 150 кредитов, что позволяет генерировать видео без ожидания. Для входа на сайт можно использовать аккаунт Google.
Почему это важно? Большинство видеомоделей уже умеют создавать красивые кадры, но с трудом справляются с сценами, персонажами и звуком одновременно. WAN 2.6 стремится решить именно эту проблему, объединяя монтаж, референсы и аудио в одном инструменте.
Предыдущая версия модели, WAN 2.5, была выпущена ранее в этом году и в первую очередь сосредоточена на базовой генерации видео. Она демонстрировала хороший визуал, но оставалась скорее экспериментальным инструментом.
В версии WAN 2.6 Alibaba значительно расширяет функционал. Модель теперь функционирует как мультимодальная система: видео, звук, изображения, монтаж и референсы. Благодаря этому WAN 2.6 напрямую попадает в один класс с универсальными видеомоделями — Veo 3.1, Sora 2, обновлённым Kling AI 2.6 и Grok, которые также делают акцент на генерации «всё сразу», без внешнего продакшена.
Итог: WAN 2.6 выводит линейку Alibaba на уровень универсальных видеомоделей: генерация сцен, стабильные персонажи, работа со звуком и изображениями теперь объединены в одном инструменте.

