Skip to main content
Что нового в DeepSeek-V4 и что умеет нейросеть

DeepSeek анонсировала предварительную версию своей новой серии DeepSeek-V4. В нее входят две модели MoE: V4-Pro с 1,6 трлн параметров и V4-Flash с 284 млрд параметров.

При генерации, V4-Pro использует 49 млрд параметров, тогда как V4-Flash задействует 13 млрд. Оба варианта уже доступны в чате DeepSeek. V4-Pro функционирует в режиме Эксперт, а V4-Flash — в Быстром. Через API их можно использовать под именами deepseek-v4-pro и deepseek-v4-flash. DeepSeek также разместила модели на Hugging Face. Дополнительная информация в статье Postium.

Читайте также: 5 лучших нейросетей для работы

Что нового в DeepSeek-V4 и что умеет нейросеть

DeepSeek-V4 основана на архитектуре Mixture-of-Experts. В данной системе модель состоит из группы “экспертов”, но для конкретного запроса активируется лишь часть из них. Следовательно, даже если V4-Pro имеет 1,6 трлн параметров, на практике она использует только 49 млрд для генерации.

V4-Pro предназначена для решения сложных задач: рассуждений, программирования, работы с длинными контекстами и запросами, где качество имеет большее значение, чем скорость. V4-Flash является более легкой версией, оптимизированной для быстрого ответа и ситуаций, где критичны задержка и стоимость.

Обе модели способны обрабатывать контекст до 1 млн токенов. Это особенно полезно для задач, связанных с большими документами, длинными переписками, кодовыми базами и агентными сценариями, где требуется удержание значительного объема исходных данных в одном запросе.

Согласно внутренним бенчмаркам DeepSeek, V4-Pro демонстрирует наилучшие результаты в режиме Max. Модель набрала 93,5 на LiveCodeBench, 3206 рейтинг на Codeforces, 80,6% на SWE Verified и 67,9 на Terminal Bench 2.0.

DeepSeek V4 на бенчмарках

Как пользоваться DeepSeek V4

Перейдите в чат-бот DeepSeek — отдельно выбирать V4 не требуется, так как она активна по умолчанию. Переключение между версиями осуществляется через режимы: «эксперт» активирует V4-Pro, а «быстрый» — V4-Flash. После этого можно сразу вводить свой запрос.

Как пользоваться DeepSeek V4

В DeepSeek API новые модели доступны под наименованиями deepseek-v4-pro и deepseek-v4-flash. Разработчики могут выбирать старшую модель для сложных запросов и Flash-версию для быстрых массовых задач.

Стоимость V4-Flash составляет $0,14 за 1 млн входных токенов и $0,28 за 1 млн выходных. При кэшировании входные токены стоят $0,028 за 1 млн. V4-Pro имеет более высокую цену: $1,74 за 1 млн входных токенов, $3,48 за 1 млн выходных и $0,145 за входные токены при кэшировании.

Почему это важно? DeepSeek разделяет два сценария в рамках одной линейки. V4-Pro решает задачи, требующие максимальной точности и стабильности при длинном контексте. V4-Flash подходит для ситуаций, где критичнее скорость ответа и стоимость запроса.

Основное преимущество заключается не только в размере моделей, но и в сочетании открытых весов, длинного контекста и архитектуры MoE. DeepSeek вновь стремится предоставить разработчикам альтернативу закрытым моделям — с опцией развернуть или адаптировать систему под свои нужды.

DeepSeek ранее выпускала открытые модели V3 и R1. V4 продолжает эту линию: крупные MoE-модели, открытая публикация и разделение на версии для различных режимов работы.

Итог: DeepSeek-V4 вводит в экосистему компании две модели для различных сценариев: V4-Pro — для сложных задач, V4-Flash — для быстрых запросов с меньшими вычислительными затратами.

DeepSeek Нейросети

Close Menu
Новости интернет маркетинга, сайтов, новости нейросетей и технологий