Skip to main content
Baidu представила ERNIE 5.0

На мероприятии Baidu World 2025 компания Baidu представила ERNIE 5.0 — мультимодальную модель, которая была обучена работать одновременно с текстами, изображениями, аудиозаписями и видео.

По словам разработчиков, модель значительно улучшила навыки в понимании контекста, выполнении указаний, креативном написании и мультимодальном анализе. Postium выделил ключевые моменты.

Читайте также: Топ чат-ботов на базе ИИ

Что нового в ERNIE 5.0

Baidu утверждает, что ERNIE 5.0 является шагом к созданию «единых» ИИ-моделей, которые не требуют отдельных модулей для каждого типа данных. Это имеет важное значение для задач, таких как анализ документов, интерпретация диаграмм, распознавание мелкого текста на изображениях и создание мультимедийного контента.

Внутренние испытания компании показывают, что ERNIE 5.0 находится на уровне с Google Gemini 2.5 Pro и OpenAI GPT-5-High.

Что нового в ERNIE 5.0

Возможности ERNIE 5.0:

  1. Нативная мультимодальность. Модель взаимодействует с текстом, изображениями, аудио и видео, что уменьшает количество «прослоек» между ними и повышает качество анализа.
  2. Фокус на логике и последовательности. По информации китайских медиа, модель обладает 2,4 трлн параметров и улучшенными механизмами рассуждений — улучшенная память, последовательность и точность.
  3. Режим «мышления по изображению». ERNIE 5.0 может увеличивать нужные участки изображения, распознавать мелкие детали и сочетать визуальный анализ с поиском. Это необходимо для работы с диаграммами, документами и редкими фактами.
  4. Экосистема вокруг модели. ERNIE 5.0 становится основой целого ряда продуктов Baidu: виртуальные ведущие и консультанты, no-code-конструктор Miaoda, агенты GenFlow, новый Famou, рабочее пространство Oreate и сервис MeDo.

Доступность: Модель уже доступна и используется в обновлённом Ernie Bot 5.0 и сервисах Baidu Cloud. Информация о доступности на международных рынках пока не раскрыта — Baidu лишь пообещала вывести часть продуктов за пределы Китая.

Почему это имеет значение? Для сферы ИИ это указывает на то, что китайские компании переходят от стратегии догоняния к конкурентоспособной позиции среди глобальных игроков. Baidu делает акцент на своей вертикали: собственные модели, свои чипы (M100 и M300), свои суперузлы. Это снижает зависимость от NVIDIA и укрепляет позиции компании на внутреннем рынке.

Линейка ERNIE развивается с 2019 года. В 2023 году Baidu показала ERNIE Bot — китайский аналог ChatGPT, а затем ERNIE 4.0, который, по заявлению компании, сопоставим с GPT-4.

В 2024–2025 годах Baidu активно обновляла линейку, снижала цены и сделала Ernie Bot бесплатным, чтобы конкурировать с китайскими игроками, такими как DeepSeek. ERNIE 5.0 является логичным продолжением этой стратегии: крупная мультимодальная модель, ориентированная на широкий спектр задач — от персональных агентов до корпоративных ИИ-систем.

Итог: ERNIE 5.0 акцентирует внимание на глубоком мультимодальном анализе. Она не только понимает текст, но и способна «думать по картинкам»: распознавать мелкие детали, разбирать схемы, анализировать видео. По уровню Baidu ставит её в один ряд с GPT-5 и Gemini. Модель станет основой для агентов и сервисов Baidu на внутреннем рынке, но также может появиться и на международных.

Ранее OpenAI представила обновлённую флагманскую модель GPT-5.1.

Baidu Нейросети

Close Menu
Новости интернет маркетинга, сайтов, новости нейросетей и технологий