
Kling представил модель VIDEO 2.6 — свой первый генератор, который создает визуализацию и звук одновременно. Один запрос превращается в завершённый ролик с диалогами, реальными звуками и эффектами, без необходимости в монтаже или внешних сервисах.
Эта модель уже доступна для пользователей на сайте Kling, а также на партнерских платформах и плейграундах. Подробности можно найти в материале Postium.
Также читайте: 5 нейросетей для генерации видео
Нейросеть Kling VIDEO 2.6 — возможности и принцип работы
VIDEO 2.6 генерирует как визуал, так и звук в рамках одной модели. Она одновременно анализирует, что происходит в кадре, кто говорит, какие эмоции выражаются и какие звуки должны сопровождать сцену. В результате получается уже готовый клип, где синхронизируются движение губ, ритм и звук.
Что нового:
- Видеоряд и звук теперь создаются одновременно и синхронно.
- Голоса звучат естественно, а движения губ совпадают с речью.
- В запросе можно указывать эмоции, тембр, шумы и отдельные звуковые эффекты.
- Диалоги, монологи и музыкальные вставки формируются за один раз.
Главная особенность заключается в том, что звук не накладывается поверх видео. Он создаётся одновременно с визуалом и автоматически синхронизируется.
Как использовать Kling VIDEO 2.6?
Функция доступна в интерфейсах Kling, на различных агрегаторах (Higgsfield) и плейграундах (Fal Ai, Wavespeed).
На сайте Kling VIDEO 2.6 функционирует в двух режимах: text-to-video и image-to-video.
В режиме text-to-video необходимо ввести детализированный промт для генерации видео. В нём описываются сцена, персонажи, их реплики, эмоции, звуки окружения, музыка и любые эффекты. Затем обязательно активируйте опцию «Native audio» — именно она включает встроенную озвучку. После генерации появляется ролик, где визуал и звук уже объединены в один файл.

В режиме image-to-video принцип остается тем же, только вы добавляете один начальный кадр или несколько фреймов, которые служат основой сцены. Далее прописываете промт с звуками, диалогами и атмосферой. Опцию «Native audio» также нужно обязательно активировать. Модель на основе кадров и текста выдаёт короткий озвученный эпизод.
Цена. На платформе Kling подписка Standard, которая включает VIDEO 2.6, начинается от 7 долларов в месяц. Бесплатного доступа нет, протестировать без оплаты не получится.
На WaveSpeed одна генерация text-to-video стоит $1,4 — для сравнения, у Veo 3.1 такой же запрос обойдётся примерно в $3,2.
Почему это имеет значение? Это третий релиз Kling за три дня. Сначала вышла Kling O1, рассуждающая модель для создания и редактирования видео. Затем появилась IMAGE O1 — новая модель для генерации и редактирования изображений. VIDEO 2.6 продолжает серию обновлений, и мы ожидаем как минимум ещё два релиза.
Итог: один текстовый запрос теперь превращается в короткий видеоролик со звуком — без ручной озвучки и монтажа.

