
Meta* анонсировала новое поколение моделей искусственного интеллекта — Llama 4, которое включает в себя две модели: Llama 4 Scout и Llama 4 Maverick. Эти модели уже применяются в помощнике Meta AI* на платформах и в приложениях WhatsApp*, Messenger* и Instagram*, а также доступны для загрузки.
Llama 4 Scout — это компактная модель, которая может функционировать на одном графическом процессоре Nvidia H100. Она обладает контекстным окном — «рабочей памятью» ИИ — в 10 миллионов токенов. Согласно заявлениям Meta*, Scout превосходит модели от Google (Gemma 3, Gemini 2.0 Flash-Lite) и популярную open-source модель Mistral 3.1 в широком спектре задач.
Llama 4 Maverick — более продвинутая модель, сопоставимая по характеристикам с GPT-4o от OpenAI и Gemini 2.0 от Google. В задачах программирования и логики Maverick показывает сопоставимые результаты с DeepSeek-V3, при этом используя менее половины активных параметров.
Meta* также разрабатывает третью, наиболее мощную модель — Llama 4 Behemoth. Она включает 288 миллиардов активных параметров и в общей сложности 2 триллиона. Хотя она еще не доступна публично, в компании утверждают, что Behemoth уже демонстрирует выдающиеся результаты в задачах STEM и превосходит GPT-4.5 и Claude 3.7 Sonnet.
Все модели Llama 4 созданы на основе архитектуры Mixture of Experts (MoE) — это значит, что модель использует лишь часть своей «экспертизы» для выполнения конкретной задачи, что снижает вычислительную нагрузку и ускоряет процессы.
Несмотря на заявления Meta* о «открытости» моделей, лицензия Llama остается ограничительной: компаниям с аудиторией более 700 миллионов пользователей в месяц необходимо получить разрешение от Meta* для коммерческого использования моделей. Это вызывает сомнения в их статусе как по-настоящему open-source.
Больше информации о будущем Llama 4 и ИИ-продуктах Meta* компания планирует поделиться на своей конференции LlamaCon, которая состоится 29 апреля 2025 года.
*Meta признана в России экстремистской организацией и запрещена на территории РФ.