
Компания Alibaba официально представила Qwen 3 — новое поколение своих языковых моделей, созданных для решения разнообразных задач в сфере искусственного интеллекта.
Модели Qwen 3 показывают впечатляющие результаты в областях программирования, математики и логического вывода, что делает их серьезными конкурентами для OpenAI o3-mini и других передовых решений.
Читайте также: 10 курсов по работе с нейросетями
Возможности Qwen 3 и рекомендации по использованию
- Масштаб и архитектура: Линейка включает как плотные модели (от 0.6B до 32B параметров), так и разреженные (до 235B параметров), обеспечивая гибкость в использовании и оптимизацию ресурсов.
- Контекстное окно: Большинство моделей поддерживают контекст до 128 000 токенов, что позволяет обрабатывать большие объемы данных без потери качества.
- Многоязычность: Поддержка 119 языков и диалектов, включая русский, делает Qwen 3 универсальным инструментом для глобального применения.
- Открытый исходный код: Модели доступны под лицензией Apache 2.0, что допускает их свободное использование и интеграцию в разные проекты.
В бенчмарках Qwen 3 демонстрирует результаты, которые сопоставимы или превосходят модели OpenAI o3-mini. Особенно заметны достижения в задачах, требующих логического мышления и программирования. Например, модель QwQ-32B, предшественник Qwen 3, уже показывала превосходство над o1-mini в математических тестах AIME и MATH.
Пользователи могут протестировать модели Qwen 3 через платформу chat.qwen.ai или скачать их с Hugging Face и ModelScope.
Ранее компания Xiaomi представила нейросеть MiMo, обладающую способностями к рассуждению.