
Китайский стартап DeepSeek произвел настоящий переворот в области искусственного интеллекта. Их чат-бот стал самым скачиваемым приложением в американском App Store, вытеснив с первого места ChatGPT от OpenAI.
За этим достижением стоит революционная модель DeepSeek R1, которая не только конкурирует с лидерами сектора, но и нарушает устоявшиеся правила игры.
В чем заключается секрет? DeepSeek удалось обучить свою модель всего за 6 миллионов долларов, использовав только 2000 GPU от Nvidia. Для сравнения: OpenAI потратила более 100 миллионов долларов на обучение GPT-4 и задействовала около 16 000 чипов. Это позволило DeepSeek не только сократить затраты, но и уменьшить стоимость API на 95%.
Новая архитектура от DeepSeek меняет сам подход к искусственному интеллекту. Вместо традиционной обработки больших объемов данных модель применяет «мультиэкспертный подход» и более эффективные методы предсказания. Результат: высокая точность и значительная экономия ресурсов.
На фоне этого акции Nvidia, главного поставщика GPU для искусственного интеллекта, упали более чем на 12% на предварительных торгах. Аналитики и инвесторы начинают задаваться вопросом, оправданы ли многомиллионные вложения в устаревшие методы, когда DeepSeek демонстрирует, что можно создавать искусственный интеллект более доступным и эффективным способом.
DeepSeek стремительно набирает популярность. В данный момент их приложения для iOS и Android предлагают пользователям доступ к продвинутым языковым моделям с открытым исходным кодом. Более того, бот способен выходить в интернет, решать сложные математические задачи и даже общаться на русском языке.
Ранее Alibaba представила ИИ-модель Qwen, которая может обрабатывать до 1 миллиона токенов.