
Китайская компания DeepSeek анонсировала линейку мультимодальных моделей Janus Pro, которые, по словам стартапа, превосходят Stable Diffusion 3 Medium и DALL-E 3 от OpenAI.
Эти ИИ-модели для генерации изображений с открытым исходным кодом доступны для бесплатного использования на платформе Hugging Face.
Модели Janus Pro варьируются от 1 до 7 миллиардов параметров и способны анализировать изображения и создавать новые. Однако на данный момент их разрешение ограничено 384×384 пикселей. Попробовать нейросеть можно по предложенной ссылке. В разделе «Text-to-Image» введите свой промпт и нажмите «сгенерировать».
Наиболее мощная версия нейросети — Janus-Pro-7B — продемонстрировала отличные результаты в тестировании GenEval и DPG-Bench.
DeepSeek утверждает, что Janus Pro обходит предыдущую версию — Janus, выпущенную в конце 2024 года, благодаря улучшенному процессу обучения, более качественным данным и увеличенному количеству параметров модели.
27 января 2025 года приложение DeepSeek стало самым скачиваемым бесплатным приложением в американском App Store, обогнав ChatGPT от OpenAI. Однако высокая популярность привела к возникновению трудностей: некоторые пользователи столкнулись с сбоями, и компании пришлось временно ограничить регистрацию из-за кибератаки.
Ранее Alibaba выпустила ИИ-модель Qwen, способную обрабатывать до 1 миллиона токенов.