Odyssey представила Starchild-1 — мультимодальную world model, которая одновременно генерирует изображение и звук в процессе создания сцены. Компания утверждает, что это первая система подобного типа, работающая в реальном времени.
Модель не создает заранее подготовленный видеоролик по запросу. Она продолжает разрабатывать сцену кадр за кадром и реагирует на действия пользователя во время генерации. Odyssey пока продемонстрировала лишь предварительный просмотр. Сроки официального запуска компания не раскрыла. Дополнительные детали можно найти в материале Postium.
Читайте также: 7 лучших нейросетей для генерации видео
Нейросеть Starchild-1 — возможности и принцип работы
Starchild-1 относится к классу world models — моделей, которые обучаются симулировать поведение окружающей среды на основе видео, движения объектов и взаимодействий внутри сцены.
Ключевая особенность модели — синхронная генерация аудио и видео. Starchild-1 одновременно предсказывает следующий видеокадр и следующий звуковой фрагмент, чтобы сцена оставалась согласованной как визуально, так и по звуку.

Odyssey акцентирует внимание на работе в реальном времени. Обычные видеогенераторы, такие как Veo или Sora, создают ролик целиком после начала генерации. Пользователь ожидает результат, в то время как сама сцена остается неизменной.
Starchild-1 функционирует более похоже на игровой движок: сцена продолжает формироваться в процессе взаимодействия. Пользователь может изменять направление камеры, перемещение или действия внутри сцены, а модель адаптирует видео и звук в реальном времени.
В опубликованных демо материалы Odyssey демонстрируют прогулки по улицам, движение транспорта, интерьеры и окружение с пространственным звуком. Модель поддерживает длинные непрерывные сцены вместо коротких отдельных клипов.
Почему это важно? Большинство ИИ-видеогенераторов до сих пор работают как офлайн-рендер: пользователь вводит запрос, получает видео и при каждом изменении сцены запускает генерацию заново.
World models движутся в ином направлении — к интерактивным средам, где ИИ постоянно поддерживает симуляцию мира и реагирует на действия в реальном времени.
Для Odyssey это попытка занять промежуточную нишу между генераторами видео и игровыми движками. Такие модели могут применяться в интерактивных фильмах, играх, виртуальных пространствах и ИИ-интерфейсах, где сцена не фиксирована заранее.
Итог: представлена Starchild-1 — нейросеть для генерации открытого мира.

