
Китайская фирма DeepSeek анонсировала обновлённую версию своей reasoning-модели R1, получившую название R1-0528. Данная модель уже доступна на платформе Hugging Face, однако официальные детали и анонс от разработчиков еще не были опубликованы.
Тем не менее, предварительные испытания показывают, что R1-0528 обладает улучшенными возможностями в генерации кода и структурировании ответов.
Согласно результатам бенчмарка LiveCodeBench, разработанного университетами Беркли, MIT и Корнеллом, обновлённая модель R1 занимает позицию сразу после o4-mini и o3 от OpenAI, обгоняя Grok 3 mini от xAI и Qwen 3 от Alibaba. Это подтверждает, что DeepSeek продолжает укреплять свои позиции в области искусственного интеллекта, несмотря на недостаток подробной информации об обновлении.
Ранее, в январе 2025 года, DeepSeek представила первую версию модели R1, которая была полностью открыта и лицензирована по MIT. Эта модель отличалась высокой эффективностью в задачах, связанных с математикой, программированием и логикой, и предлагала пользователям 50 бесплатных запросов в день. Кроме того, R1 применяла инновационный подход к обучению с подкреплением, что позволяло ей достигать выдающихся результатов при минимальных затратах.
Ожидается, что в ближайшее время DeepSeek продемонстрирует более продвинутую модель R2, запланированную к выпуску в мае. Тем временем обновлённая версия R1-0528 продолжает подтверждать конкурентоспособность китайских разработок в области искусственного интеллекта.
Ранее Яндекс научился генерировать контент непосредственно в Поиске.


