
Компания OpenAI сделала долгожданный анонс: GPT-5 будет выпущена этим летом и станет первой действительно универсальной мультимодальной моделью, которая сможет обрабатывать текст, аудио, изображения и видео в одном интерфейсе.
Это подразумевает, что пользователи смогут не только получать текстовые ответы, но и создавать контент в различных форматах без необходимости переключения между отдельными инструментами – больше информации можно найти в материале Postium.
Читайте также: 10 лучших курсов по работе с ChatGPT
Что представляет собой GPT-5 и как она будет функционировать?
До настоящего времени даже самые современные ИИ-модели функционировали раздельно: одна для текста, другая для изображений, третья – для аудио. GPT-5 разрушает эти преграды, предлагая первый в мире ИИ, который понимает и создает контент в любом формате. Это может значительно изменить подход к образованию, работе с медиа и автоматизации бизнес-процессов.
Подробности:
- Полная мультимодальность – модель будет способна анализировать и создавать контент в любых форматах: от написания эссе до редактирования видео по текстовому запросу.
- Единый интерфейс – больше не потребуется переключаться между ChatGPT, DALL·E и Whisper – все функции собраны в одном чате.
- Улучшенный контекст – ожидается, что GPT-5 сможет запоминать и учитывать значительно больше информации во время диалога по сравнению с GPT-4 Turbo.
- Голосовой ассистент нового уровня – OpenAI намерена внедрить естественное двустороннее голосовое взаимодействие, что сделает ChatGPT конкурентом Alexa и Siri.
Когда стоит ожидать релиз? Точная дата не была озвучена, но OpenAI подтвердила, что тестирование уже активно ведется, а публичный запуск ожидается в августе-сентябре 2025 года. Первые доступ получат платные подписчики ChatGPT Plus и Enterprise, а затем, возможно, появится бесплатная ограниченная версия.
Кроме того, в ближайшие недели может состояться презентация возможностей GPT-5 – возможно, OpenAI продемонстрирует, как модель редактирует видео по голосовой команде или создает изображения в реальном времени во время чата.
Ранее в Нейроэксперте Яндекса появился режим рассуждений.


