Google выпустила EmbeddingGemma — мощную нейросеть для работы прямо на телефоне

Google представила EmbeddingGemma — компактную модель с 308 миллионами параметров, которая может храниться в памяти смартфона и функционировать офлайн. Она уже доступна в открытом доступе с коммерческой лицензией.

Модель требует менее 200 МБ оперативной памяти и обрабатывает текст с задержкой всего 15 миллисекунд. При этом она демонстрирует наилучшие результаты среди открытых моделей с количеством параметров до 500 миллионов в бенчмарке MTEB.

Читайте также: 6 лучших ИИ-чат-ботов

Возможности EmbeddingGemma

EmbeddingGemma обучена на более чем 100 языках, включая русский, и способна работать в различных размерностях. Она идеально подходит для интеграции в локальные RAG-системы и мобильные приложения.

Обрабатывает до 2048 токенов контекста — этого достаточно для обработки больших абзацев и длинных запросов.
Применяет новую схему представления (MRL), что позволяет выбирать размер эмбеддингов: от 768 до 128. Это упрощает использование на устройствах с ограниченной памятью.
Совместима с такими инструментами, как sentence-transformers, llama.cpp, MLX, LiteLLM, LangChain, LlamaIndex, Weaviate, Ollama, Cloudflare и другими популярными решениями. Ее можно легко интегрировать в локальные или серверные RAG-системы.

Результаты открытых моделей до 500 миллионов параметров в бенчмарке MTEB:

Результаты в бенчмарке MTEB

Модель является частью семейства Gemma, которое Google развивает с 2024 года. Ранее компания выпускала генеративные модели (Gemma 1, 2 и 3), но EmbeddingGemma — первая, которая сосредоточена не на генерации, а на понимании текстов и поиске информации (Text Embeddings). Она подходит для задач семантического поиска, кластеризации, категоризации и RAG (retrieval-augmented generation).

Как скачать и установить EmbeddingGemma? Нейросеть уже доступна для загрузки на Hugging Face, Kaggle и в Vertex AI. Также опубликована подробная документация с примерами интеграции.

Ранее Google представил нейросеть Nano Banana.

Тэги Google Нейросети

Google выпустила EmbeddingGemma — мощную нейросеть для работы прямо на телефоне

Возможности EmbeddingGemma

Популярные новости

ООН: человечество не научилось контролировать возможности ИИ

Ремейк Assassin’s Creed IV: Black Flag слили за день до релиза

«Ростелеком» обновил систему защиты от DDoS-атак

Госдума приняла закон о маркировке ИИ-контента

edna: цифровая нагрузка россиян выросла на 80%

Последние новости

ООН: человечество не научилось контролировать возможности ИИ

Ремейк Assassin’s Creed IV: Black Flag слили за день до релиза

«Ростелеком» обновил систему защиты от DDoS-атак

Госдума приняла закон о маркировке ИИ-контента

edna: цифровая нагрузка россиян выросла на 80%

НазадОсенью на кассах самообслуживания начнут использовать биометрию для подтверждения возраста

ДалееПервый российский LED-киноэкран выпустят в 2026 году

Google выпустила EmbeddingGemma — мощную нейросеть для работы прямо на телефоне

Возможности EmbeddingGemma

Популярные новости

Последние новости

НазадОсенью на кассах самообслуживания начнут использовать биометрию для подтверждения возраста

ДалееПервый российский LED-киноэкран выпустят в 2026 году

Лучшее от AllWeb.ru

ChatGPT для документов: создание, редактирование и анализ, +промты

Telegram за сутки заблокировал более 200 тыс. каналов

МТС будет защищать пользователей при помощи Passkey