
ElevenLabs представила новую вкладку «Image & Video (Beta)», где пользователи могут создавать изображения и видео непосредственно в интерфейсе ElevenLabs, а затем редактировать их в Studio.
Функция выпущена в бета-версии и постепенно становится доступной. Раздел располагается в боковом меню Playground. Создание видео доступно только для пользователей платных тарифов. Подробности можно найти в статье Postium.
Читайте также: Промты для GPT-5.1 в ChatGPT
Что такое «Image & Video» в ElevenLabs и как это работает
Image & Video — это единое пространство для генерации контента. Внутри доступны несколько ИИ-моделей для изображений и отдельный набор нейросетей для видео. Пользователь выбирает модель, вводит промпт, при желании добавляет референсы — и получает результат, который можно уточнять или передавать в Studio.
Для изображений доступны: Nano Banana, Seedream 4, OpenAI GPT Image 1, Flux 1 Kontext Pro, Wan 2.5. Каждая модель отображает стоимость генерации в кредитах, а также поддержку множества референсов или загрузки эталонного изображения.

Для видео можно использовать Sora 2, Veo 3.1, Kling 2.5 и другие. В меню отображаются параметры, которые можно задавать: стартовый/финальный кадр, формат (например, 16:9), разрешение (720p–1080p) и длительность.

В интерфейсе имеется единое окно генерации, где пользователь переключается между изображениями и видео, выбирает модель, настраивает параметры и запускает рендеринг.
Таким образом, ElevenLabs теперь не только озвучивает видео, но и создает визуальный контент. Вместо набора отдельных инструментов компания объединила генерацию изображений, видео и звука в одном месте.
Как пользоваться?
Пользователь открывает вкладку «Image & Video» в разделе Playground, выбирает режим (Image или Video), затем модель. Ниже на панели видны настройки: формат кадра, длительность, разрешение и другие параметры, которые зависят от выбранной модели. После ввода промпта и настройки, сервис отображает стоимость генерации.

После создания изображение или ролик можно доработать или сразу отправить в Studio, где доступны таймлайн, голоса, музыка и эффекты.
Почему это важно? ElevenLabs переходит от нишевого аудио-сервиса к полноценному инструменту для создания контента. Генерация изображений и видео в одном интерфейсе сокращает время работы и уменьшает зависимость от сторонних платформ.
Кроме того, ElevenLabs не разработали свою нейросеть, а делают ставку на интеграцию лучших доступных моделей — от OpenAI, Google и других. Это предоставляет пользователям широкий выбор и снижает порог входа.
Компания начинала с генерации речи и быстро завоевала популярность благодаря клонированию голоса и озвучке. Затем появились музыкальные инструменты, Studio 3.0 и средства локализации. Новый раздел — логичное расширение в визуальный сегмент.
Итог: ElevenLabs теперь позволяет генерировать и собирать весь видеоролик — изображение, видео и звук — внутри одной платформы, без необходимости переходить между сервисами.
Ранее xAI представила Grok 4.1 — новая ИИ-модель доступна всем без ограничений.


