Обучение модели R1 от Deepseek стоило $294 тысяч

Компания DeepSeek выпустила отчет, в котором сообщила, что на обучение своей модели R1 было потрачено $294 тыс. Эта сумма существенно ниже, чем затраты конкурентов из США в рамках их проектов. Для этого DeepSeek привлекла 512 ускорителей Nvidia H800.

Напоминаем, что запуск DeepSeek-R1 состоялся в январе текущего года, и ее успех заставил инвесторов по всему миру избавиться от акций технологических компаний, что вызвало снижение капитализации лидеров в области ИИ, включая Nvidia.

Затраты на обучение ИИ-моделей обусловлены использованием кластеров мощных чипов в течение недель или месяцев для обработки больших объемов текста и кода. Примечательно, что в 2023 году генеральный директор OpenAI Сэм Альтман заявил, что обучение базовых моделей его компании обошлось в целых $100 млн.

В процессе обучения ИИ DeepSeek применяла ускоритель H800, разработанный специально для китайского рынка, ограничив поставки более мощных H100 и A100 в КНР. Тем не менее, существует вероятность, что DeepSeek все же имеет доступ к значительным объемам H100.

Ранее команда разработчиков DeepSeek создала новую методику для самообучения моделей ИИ. Эта методика позволяет ИИ самостоятельно осваивать новые навыки и знания без вмешательства человека.

Вам может быть интересно:

Nokia представила смартфоны с DeepSeek для пожилых

Обучение модели R1 от Deepseek стоило $294 тысяч

Популярные новости

Рынок видеоигр превысил $200 млрд

Почти 70% российских компаний столкнулись с фишингом

В Китае введена в строй гигантская рыбная ферма

ScreenZen выпустила устройство против думскроллинга

ИИ-ассистент Gemini Live получил доступ к YouTube

Последние новости

Рынок видеоигр превысил $200 млрд

Почти 70% российских компаний столкнулись с фишингом

В Китае введена в строй гигантская рыбная ферма

ScreenZen выпустила устройство против думскроллинга

ИИ-ассистент Gemini Live получил доступ к YouTube

Назад13 тыс. людей, 21 страна: завершился Форум о будущем городов БРИКС

Далее11 фишек Телеграм-премиум, которые вы не используете

Обучение модели R1 от Deepseek стоило $294 тысяч

Популярные новости

Последние новости

Назад13 тыс. людей, 21 страна: завершился Форум о будущем городов БРИКС

Далее11 фишек Телеграм-премиум, которые вы не используете

Лучшее от AllWeb.ru

Instagram* добавил график удержания в Reels и метрику «Процент пропусков»

12 главных сериалов августа, которые нельзя пропустить

Резидент «Сколково» разработал бесплатный сервис для мониторинга уязвимостей