Skip to main content
Нейросеть Ideogram 4: что умеет и как работает

Компания Ideogram представила нейросеть Ideogram 4 — первую ИИ-модель с открытыми весами. Этот генератор изображений обладает 9,3 млрд параметров, его команда создала с нуля, а не на основе уже существующей модели.

Веса модели уже доступны на Hugging Face. Предлагаются две версии: NF4 для CUDA и FP8. Также компания пообещала выпустить дополнительные варианты квантизации. Более подробная информация изложена в материале Postium.

Читайте также: 25 лучших нейросетей для генерации изображений

Нейросеть Ideogram 4: что она умеет и как функционирует

Ideogram 4 ориентирована на задачи, где важны тексты внутри изображений: постеры, баннеры, упаковка, карточки товаров и другой дизайн с текстовыми элементами.

Одним из ключевых новшеств являются структурированные промпты в формате JSON. Вместо длинного текстового описания можно отдельно указывать объекты, подписи, цвета, композицию и другие элементы изображения.

Пример генерации изображения:

Нейросеть Ideogram 4

Модель поддерживает нативное разрешение 2K, соотношение сторон до 6:1 и прямое управление цветовой палитрой. Также улучшена работа с текстами на разных языках и более точное размещение объектов в кадре.

Пример генерации креатива с текстом:

Пример генерации креатива с текстом

Размер модели значительно меньше по сравнению с рядом недавних конкурентов. Для примера: Qwen-Image использует 20 млрд параметров, а FLUX.2 [dev] — 32 млрд. Согласно данным Ideogram, версия NF4 может функционировать на одной видеокарте с 24 ГБ памяти.

В тестах Ideogram 4 почти достигла уровня закрытых моделей GPT Image 2 и Nano Banana 2 по композиции, пространственному мышлению, точности объектов, следованию промпту и отрисовке текста. На внутреннем соревновании дизайнеров модель заняла второе место после GPT Image 2 и первое среди решений с открытыми весами.

Бенчмарки Ideogram 4

Как загрузить и использовать Ideogram 4

Пользователи могут опробовать Ideogram 4 непосредственно на Hugging Face Spaces по предоставленной ссылке. Демо-версия включает поле для ввода промпта, выбор режима генерации — Turbo, Default или Quality — и кнопку Generate. Ниже располагается блок Advanced с дополнительными настройками.

Как пользоваться Ideogram 4 онлайн

Веса доступны на Hugging Face в двух репозиториях: ideogram-4-nf4 и ideogram-4-fp8. NF4 предназначена для CUDA, FP8 — это отдельная версия весов. Для загрузки модели нужно открыть нужный репозиторий и согласиться с условиями доступа.

Как скачать веса Ideogram 4

Почему это имеет значение? В течение последнего года рынок генераторов изображений движется в сторону всё более крупных моделей. С ростом качества увеличиваются и требования к аппаратному обеспечению. В результате многие открытые модели сложно запускать локально без дорогостоящих видеокарт.

Ideogram выбирает иную стратегию. Компания стремится поддерживать высокое качество при относительно небольшом размере модели. Если заявленные результаты подтвердятся в реальных тестах, Ideogram 4 может стать одной из самых мощных открытых моделей, подходящей для запуска без серверного оборудования.

Однако назвать релиз полноценным open source пока нельзя. Ideogram открыла веса, но модель распространяется по лицензии Non-Commercial. Для научных исследований, экспериментов и локального запуска этого достаточно, но коммерческое использование лицензия ограничивает.

Итог: Ideogram представила компактную open-weight-модель, ориентированную на генерацию текста внутри изображений и обладающую более низкими требованиями к аппаратному обеспечению по сравнению с многими конкурентами.

Ideogram Нейросети

Close Menu
Новости интернет маркетинга, сайтов, новости нейросетей и технологий