Skip to main content
Google представила ИИ-модель Genie 3 для генерации интерактивных 3D-миров

Google DeepMind представила новую модель Genie 3, предназначенную для разработки интерактивных 3D-миров на основе текстовых описаний. Эта версия значительно усовершенствована по сравнению с предшественником Genie 2.

В отличие от Genie 2, где взаимодействие с окружающим миром было ограничено несколькими секундами, в Genie 3 пользователи могут исследовать созданную среду на протяжении нескольких минут. Эта модель предлагает высокое качество визуализации — 720p с 24 кадрами в секунду и включает поддержку физических эффектов, таких как движение воды и освещение.

Читайте также: 10 нейросетей для дизайнеров и дизайна

Что может Genie 3 — главные функции

Создание 3D-миров по текстовым описаниям. Genie 3 позволяет формировать 3D-окружение, просто описывая его словами. Например, фраза «средневековый город на фоне гор» превратится в готовую виртуальную среду. Это открывает новые горизонты для разработчиков игр, архитекторов и дизайнеров, позволяя создавать уникальные локации без необходимости в ручной проработке всех деталей.

Учет физических свойств окружающего мира. Модель научилась учитывать физику виртуального пространства, включая динамику воды, освещение и взаимодействие объектов. Это позволяет создавать более правдоподобные сцены, которые принимают во внимание природные явления. Genie 3 учитывает такие факторы, как движение воды и изменение освещения в зависимости от времени суток, что добавляет реалистичности и углубляет погружение в созданные миры.

Управление событиями через текстовые команды. В Genie 3 реализована возможность изменения состояния мира с помощью текстовых команд. Например, можно изменить погоду, добавить новых персонажей или изменить ландшафт для адаптации мира под конкретные требования. Эта гибкость открывает новые возможности для создания интерактивных историй и динамичных сюжетов.

Долговременное взаимодействие и сохранение контекста. В отличие от предыдущих версий, где взаимодействие ограничивалось 20 секундами, Genie 3 позволяет пользователям взаимодействовать с миром в течение нескольких минут, сохраняя контекст и физическую согласованность. Например, если вы вернётесь в определённое место, расположение объектов останется неизменным, что позволяет создавать более последовательные и детализированные виртуальные миры.

Genie 3 ускоряет процесс создания игровых миров, которые адаптируются под действия пользователей, а также улучшает опыт в VR, предлагая интерактивные 3D-среды. Эта модель также подходит для тренажёров и симуляторов, полезных для обучения ИИ-агентов и подготовки специалистов.

На данный момент Genie 3 доступна лишь для ограниченной группы разработчиков в рамках предварительного исследования. Это позволяет команде Google анализировать возможности модели, выявлять её сильные и слабые стороны, а также улучшать производительность перед более широким запуском.

Ранее Runway представила доступ к своему новому ИИ-видеоредактору Runway Aleph.

Google Нейросети

Close Menu
Новости интернет маркетинга, сайтов, новости нейросетей и технологий