Skip to main content
Computer Use в Gemini 3.5 Flash: что это и как работает

Google интегрировала Computer Use прямо в Gemini 3.5 Flash. Теперь разработчики способны создавать ИИ-агентов на базовой Flash-модели: они могут видеть интерфейс, анализировать задачи и совершать действия в браузере, а также в мобильных и настольных приложениях.

Ранее Computer Use существовал как отдельная модель Gemini 2.5 Computer Use. Теперь это составная часть Gemini 3.5 Flash вместе с другими функциями модели, такими как вызов функций, поиск и привязка к картам. Более подробно читайте в публикации Postium.

Также читайте: ТОП-5 нейросетей для офисной работы

Computer Use в Gemini 3.5 Flash: что это и как функционирует

Computer Use предоставляет модели доступ к интерфейсу. Агент наблюдает за экраном, осознаёт, какие элементы присутствуют, и выполняет следующие действия: нажимает на кнопки, вводит текст, переходит между страницами или проверяет результаты своих действий.

Google демонстрирует два примера. В первом Gemini 3.5 Flash исследует приложение Gemini и возвращает перечень функций, сгруппированных по категориям. Во втором случае модель проверяет документацию Google и выявляет проблемы с доступностью.

Google встроила Computer Use в Gemini 3.5 Flash для ИИ-агентов

Ключевой сценарий — это длительные задачи для агентов, где необходимо не просто ответить на запрос, а пройти через цепочку действий. Среди примеров, упомянутых Google, выделяются непрерывное тестирование программного обеспечения и работа с данными в профессиональных приложениях.

Компания также внедрила защиту от атак через prompt injection. Для Gemini 3.5 Flash используется целенаправленное обучение на сценариях атак (targeted adversarial training), а корпоративным клиентам доступны два дополнительных механизма: обязательное подтверждение чувствительных или необратимых действий и автоматическая остановка задачи при обнаружении косвенных атак через prompt injection.

Как использовать

Проверить Computer Use можно в демо-области Browserbase. Для внедрения в свои продукты Google предлагает эталонную реализацию, документацию Gemini API и платформу Gemini Enterprise Agent.

Почему это важно? Google перемещает Computer Use из отдельной модели в основную линейку Flash. Это превращает Gemini 3.5 Flash в базовую модель для развертывания ИИ-агентов.

Напоминаем, что Gemini 3.5 Flash была выпущена в мае 2026 года как новая быстрая модель Google для агентных сценариев.

Итог: Gemini 3.5 Flash теперь функционирует не только как модель для текста, инструментов и поиска, но и как основа для агентов, выполняющих длинные задачи в реальных интерфейсах.

Gemini Google Нейросети

Close Menu
Новости интернет маркетинга, сайтов, новости нейросетей и технологий