Skip to main content
DeepSeek тестирует режим «Распознавание» изображений

В интерфейсе чат-бота DeepSeek был внедрён новый режим «Распознавание», который добавляется к существующим режимам «Быстрый» и «Эксперт». В этом режиме возможно загружать и анализировать изображения: описывать объекты или сцены, идентифицировать текст на фотографиях, исследовать интерфейсы или скриншоты и многое другое.

На текущий момент функция доступна в тестовом режиме как в веб-версии, так и в мобильном приложении DeepSeek после недавнего обновления. Официальный запуск от компании пока не анонсирован. Дополнительные детали можно найти в материале Postium.

Также читайте: Нейросети для распознавания текста на фотографиях

Режим «Распознавание» в DeepSeek — как он работает

Режим «Распознавание» в DeepSeek позволяет чат-боту понимать изображения. Это добавляет возможность работы с визуальными данными в обычный чат: пользователь может загрузить фотографию, документ, таблицу, скриншот или изображение веб-страницы, а модель проведёт анализ и предоставит ответ.

Режим «Распознавание» в DeepSeek — как он работает

Режим способен распознавать текст на изображениях, анализировать интерфейсы и структурированные данные, описывать объекты и сцены, а также работать с документами и таблицами в ходе диалога. Максимально можно загрузить до 50 документов или изображений, каждый из которых не должен превышать 100 МБ.

Как распознать текст на фото с помощью DeepSeek

Если режим доступен в вашем аккаунте, выберите «Распознавание» рядом с «Быстрым» и «Экспертом». Затем загрузите изображение в чат, используя иконку скрепки.

После этого напишите, что требуется сделать. Например: «Распознай текст на фото и отправь его в ответе». DeepSeek проанализирует изображение и вернёт текст прямо в чате.

Как распознать текст на фото с помощью Дипсик

В режиме глубокого анализа можно ставить более сложные задачи. Например: сначала попросить модель описать изображение, а затем — сгенерировать промт для создания аналогичного изображения.

Как описать фото с помощью DeepSeek

Другой пример запроса: «Проанализируй скриншот интерфейса и напиши HTML-код для аналогичной страницы».

Как проанализировать скриншот и код сайта в Дипсик

Если режим отсутствует, в настоящее время нет возможности включить его вручную. Доступ зависит от этапа тестирования.

Почему это имеет значение? Новый режим позволяет решать задачи, где пользователю легче продемонстрировать изображение, чем составить запрос с нуля. Это может быть скриншот интерфейса, таблица, документ, веб-страница или фотография.

Для DeepSeek это ещё один шаг к созданию мультимодального чат-бота. Сервис начинает обрабатывать не только текст, но и визуальные данные в одном диалоге.

Ранее компания представила ИИ-модели линейки DeepSeek-V4, в которую вошли две MoE-модели: V4-Pro с 1,6 трлн параметров и V4-Flash с 284 млрд параметров.

Итог: DeepSeek начал предоставлять доступ к новому режиму «Распознавание», который добавляет в чат возможность анализа изображений, документов, таблиц и интерфейсов.

DeepSeek Нейросети

Close Menu
Новости интернет маркетинга, сайтов, новости нейросетей и технологий