Skip to main content

Alibaba представила предварительную версию модели Qwen3-Max-Thinking — это промежуточный этап, который всё ещё находится в процессе обучения. Тем не менее, благодаря использованию инструментов и увеличенной вычислительной мощности на этапе инференса модель продемонстрировала 100% точность на сложных олимпиадных тестах AIME 2025 и HMMT.

Попробовать ИИ-модель можно уже сейчас в Qwen Chat и через API Alibaba Cloud. Это первый публичный демонстрационный показ версии «thinking» Qwen3, которая акцентирует внимание на многошаговых размышлениях и способности планировать решения сложных задач. Дополнительные подробности можно найти в материале Postium.

Читайте также: 6 лучших чат-ботов на базе ИИ

Что нового в Qwen3-Max-Thinking?

Чтобы начать использование Qwen3-Max-Thinking, выберите модель «Qwen3-Max» и активируйте режим «Thinking».

Промежуточный релиз. Qwen3-Max-Thinking не является окончательным продуктом, а представляет собой «intermediate checkpoint»: модель продолжает дообучение, и результаты планируется улучшать. Alibaba специально открыла доступ к этой промежуточной версии, чтобы продемонстрировать потенциал новой архитектуры.

Режим рассуждений. Главной особенностью является так называемое tool-augmented reasoning. Это означает, что модель не просто генерирует ответ, а может подключать внешние инструменты, такие как калькулятор, интерпретатор кода или поиск, для уточнения промежуточных шагов. По сути, она «размышляет» как человек, который сначала обдумывает решение, а затем проверяет его на черновике или с помощью калькулятора.

100% на бенчмарках — с оговоркой. Заявленные 100% на AIME и HMMT были достигнуты при использовании дополнительных инструментов и увеличенных вычислений во время тестирования — то есть при запуске модели с расширенным количеством проходов и вычислений. В стандартном режиме показатели будут ниже, но достижение «идеального» результата в усиленной конфигурации демонстрирует потенциал новой архитектуры.

Как развивается чат-бот Qwen

Alibaba последовательно расширяет линейку Qwen — от базовых моделей до специализированных версий для рассуждений и генерации кода.

  • Весной 2024 года компания представила QwQ-32B, нацеленную на задачи reasoning;
  • Осенью была выпущена Qwen3-Max, одна из крупнейших и мощнейших моделей Alibaba, которая конкурирует с GPT-4 и Claude 3 в логических и программных задачах;
  • Сейчас добавлен режим «Мышление», где акцент делается на глубине рассуждений, а не на скорости генерации.

Qwen3-Max-Thinking напрямую конкурирует с другими «reasoning»-моделями — DeepSeek-R, OpenAI o1 и Claude 3.5 Sonnet, которые также развивают концепцию увеличенной вычислительной мощности на этапе инференса и многошагового мышления.

Ранний доступ к Qwen3-Max-Thinking доступен для пользователей Qwen Chat и разработчиков через API Alibaba Cloud Model Studio.

Итог: Qwen3-Max-Thinking — шаг Alibaba к ИИ, который не просто отвечает, а умеет задумываться. Пока модель демонстрирует идеальные результаты лишь в усиленном режиме, но данный подход приближает нейросети к человеческому стилю рассуждений.

Qwen Нейросети

Close Menu
Новости интернет маркетинга, сайтов, новости нейросетей и технологий