Skip to main content
Нейросеть LTX-2.3

LTX Studio представила LTX-2.3 — обновленную версию видеомодели, которая уже интегрирована в сервис. В то же время модель выпущена как open-source и доступна через API.

Обновление уже доступно: LTX-2.3 используется в Studio, доступна через API и может работать локально. Добавлена возможность генерации вертикального видео 1080×1920, длительностью до 20 секунд, поддержка до 4K и 50 fps. Дополнительные детали можно найти в материале Postium.

Читайте также: 5 приложений для генерации видео

Что нового в LTX-2.3

LTX-2.3 — это модель диффузионного трансформера, которая создает видео и синхронизированный звук за один проход. Поддерживает text-to-video, image-to-video и audio-to-video, а также вертикальное видео без обрезки.

В обновлении была изменена основная архитектура. Latent space был пересобран с использованием нового VAE — это улучшило сохранение текстур, волос, мелких деталей и краев. Также увеличен текстовый коннектор: модель теперь более точно обрабатывает сложные запросы с несколькими объектами, движением и стилем.

— В отдельности была переработана функция image-to-video: уменьшено количество “залипаний” и псевдодвижений, увеличена реальная динамика в сцене. Также обновлено аудио — добавлен новый вокодер и очищен датасет для снижения шумов и провалов.

— Видео стало более стабильным: сцены реже “разваливаются”, движение выглядит более естественным, а не как набор переходов. Запросы обрабатываются более точно — особенно сложные, с несколькими объектами и взаимодействиями.

— Появилась нативная генерация вертикального видео 1080×1920, которая обучалась на соответствующих данных, а не была получена путем обрезки горизонтального кадра.

Что нового в LTX-2.3

— Модель генерирует до 20 секунд видео, поддерживает до 4K и 50 fps и предлагает два режима: быстрый для итераций и более точный для финального результата.

Как пользоваться

Перейдите в LTX Studio, откройте playground, выберите режим pro или fast и задайте запрос — модель уже встроена и доступна для генерации видео.

Шаг 1. Заходим на сайт LTX Studio и переходим в раздел Playground. Выбираем способ генерации:

  • Text to Video — создает видео по текстовому описанию.
  • Image to Video — преобразует загруженное изображение в анимированный ролик.
  • Audio to Video — генерирует видео на основе аудио с синхронизацией звука и сцены.

Шаг 2. Вводим запрос. В поле Prompt подробно описываем сцену: кто, где, что делает, настроение, освещение, стиль. В LTX-2.3 по-прежнему действуют общие принципы запросов для генерации видео, но модель лучше распознает сложные сцены с несколькими объектами и взаимодействиями.

Шаг 3. Настраиваем параметры генерации. Под полем запроса выбираем необходимые параметры:

  • Model — выбираем LTX-2.3 Fast или LTX-2.3 Pro. Fast быстрее и подходит для итераций, Pro медленнее, но обеспечивает более точную генерацию, лучшее качество и стабильное движение.
  • Duration — длина ролика (до 20 секунд).
  • Resolution — качество видео (до 4K, включая вертикальный формат 1080×1920).
  • FPS — частота кадров (например, 25 или 50).
  • Audio — можно включить, чтобы модель сразу сгенерировала синхронизированный звук или речь.

Что умеет нейросеть LTX-2.3 и как работает

Шаг 4. Генерируем видео. Нажимаем Generate video — начинается рендеринг. В режиме Fast результат появляется быстрее и подходит для итераций, Pro — занимает больше времени, но обеспечивает более стабильное изображение, точную работу с движением и лучшее соответствие запросу.

Для разработчиков доступен API с двумя режимами: fast и pro. Также есть возможность скачать веса и развернуть модель локально или через такие инструменты, как ComfyUI.

Почему это важно? Главное — открытые веса. Это снижает барьер для входа: модель можно использовать вне экосистемы LTX, в собственных пайплайнах и продуктах. Речь идет не только о сервисе, но и об инфраструктурном инструменте.

LTX-2.3 — это эволюция модели LTX-2. В новой версии обновлены четыре ключевых компонента: детализация через VAE, понимание текста, вертикальное видео и аудио.

Итог: LTX Studio перешла на LTX-2.3 — модель стала более точной, стабильной и доступна не только внутри сервиса, но и как открытая технология.

LTX Нейросети

Close Menu
Новости интернет маркетинга, сайтов, новости нейросетей и технологий