
LTX Studio представила LTX-2.3 — обновленную версию видеомодели, которая уже интегрирована в сервис. В то же время модель выпущена как open-source и доступна через API.
Обновление уже доступно: LTX-2.3 используется в Studio, доступна через API и может работать локально. Добавлена возможность генерации вертикального видео 1080×1920, длительностью до 20 секунд, поддержка до 4K и 50 fps. Дополнительные детали можно найти в материале Postium.
Читайте также: 5 приложений для генерации видео
Что нового в LTX-2.3
LTX-2.3 — это модель диффузионного трансформера, которая создает видео и синхронизированный звук за один проход. Поддерживает text-to-video, image-to-video и audio-to-video, а также вертикальное видео без обрезки.
В обновлении была изменена основная архитектура. Latent space был пересобран с использованием нового VAE — это улучшило сохранение текстур, волос, мелких деталей и краев. Также увеличен текстовый коннектор: модель теперь более точно обрабатывает сложные запросы с несколькими объектами, движением и стилем.
— В отдельности была переработана функция image-to-video: уменьшено количество “залипаний” и псевдодвижений, увеличена реальная динамика в сцене. Также обновлено аудио — добавлен новый вокодер и очищен датасет для снижения шумов и провалов.
— Видео стало более стабильным: сцены реже “разваливаются”, движение выглядит более естественным, а не как набор переходов. Запросы обрабатываются более точно — особенно сложные, с несколькими объектами и взаимодействиями.
— Появилась нативная генерация вертикального видео 1080×1920, которая обучалась на соответствующих данных, а не была получена путем обрезки горизонтального кадра.

— Модель генерирует до 20 секунд видео, поддерживает до 4K и 50 fps и предлагает два режима: быстрый для итераций и более точный для финального результата.
Как пользоваться
Перейдите в LTX Studio, откройте playground, выберите режим pro или fast и задайте запрос — модель уже встроена и доступна для генерации видео.
Шаг 1. Заходим на сайт LTX Studio и переходим в раздел Playground. Выбираем способ генерации:
- Text to Video — создает видео по текстовому описанию.
- Image to Video — преобразует загруженное изображение в анимированный ролик.
- Audio to Video — генерирует видео на основе аудио с синхронизацией звука и сцены.
Шаг 2. Вводим запрос. В поле Prompt подробно описываем сцену: кто, где, что делает, настроение, освещение, стиль. В LTX-2.3 по-прежнему действуют общие принципы запросов для генерации видео, но модель лучше распознает сложные сцены с несколькими объектами и взаимодействиями.
Шаг 3. Настраиваем параметры генерации. Под полем запроса выбираем необходимые параметры:
- Model — выбираем LTX-2.3 Fast или LTX-2.3 Pro. Fast быстрее и подходит для итераций, Pro медленнее, но обеспечивает более точную генерацию, лучшее качество и стабильное движение.
- Duration — длина ролика (до 20 секунд).
- Resolution — качество видео (до 4K, включая вертикальный формат 1080×1920).
- FPS — частота кадров (например, 25 или 50).
- Audio — можно включить, чтобы модель сразу сгенерировала синхронизированный звук или речь.

Шаг 4. Генерируем видео. Нажимаем Generate video — начинается рендеринг. В режиме Fast результат появляется быстрее и подходит для итераций, Pro — занимает больше времени, но обеспечивает более стабильное изображение, точную работу с движением и лучшее соответствие запросу.
Для разработчиков доступен API с двумя режимами: fast и pro. Также есть возможность скачать веса и развернуть модель локально или через такие инструменты, как ComfyUI.
Почему это важно? Главное — открытые веса. Это снижает барьер для входа: модель можно использовать вне экосистемы LTX, в собственных пайплайнах и продуктах. Речь идет не только о сервисе, но и об инфраструктурном инструменте.
LTX-2.3 — это эволюция модели LTX-2. В новой версии обновлены четыре ключевых компонента: детализация через VAE, понимание текста, вертикальное видео и аудио.
Итог: LTX Studio перешла на LTX-2.3 — модель стала более точной, стабильной и доступна не только внутри сервиса, но и как открытая технология.


