DeepSeek тестирует режим «Распознавание» изображений

В интерфейсе чат-бота DeepSeek был внедрён новый режим «Распознавание», который добавляется к существующим режимам «Быстрый» и «Эксперт». В этом режиме возможно загружать и анализировать изображения: описывать объекты или сцены, идентифицировать текст на фотографиях, исследовать интерфейсы или скриншоты и многое другое.

На текущий момент функция доступна в тестовом режиме как в веб-версии, так и в мобильном приложении DeepSeek после недавнего обновления. Официальный запуск от компании пока не анонсирован. Дополнительные детали можно найти в материале Postium.

Также читайте: Нейросети для распознавания текста на фотографиях

Режим «Распознавание» в DeepSeek — как он работает

Режим «Распознавание» в DeepSeek позволяет чат-боту понимать изображения. Это добавляет возможность работы с визуальными данными в обычный чат: пользователь может загрузить фотографию, документ, таблицу, скриншот или изображение веб-страницы, а модель проведёт анализ и предоставит ответ.

Режим способен распознавать текст на изображениях, анализировать интерфейсы и структурированные данные, описывать объекты и сцены, а также работать с документами и таблицами в ходе диалога. Максимально можно загрузить до 50 документов или изображений, каждый из которых не должен превышать 100 МБ.

Как распознать текст на фото с помощью DeepSeek

Если режим доступен в вашем аккаунте, выберите «Распознавание» рядом с «Быстрым» и «Экспертом». Затем загрузите изображение в чат, используя иконку скрепки.

После этого напишите, что требуется сделать. Например: «Распознай текст на фото и отправь его в ответе». DeepSeek проанализирует изображение и вернёт текст прямо в чате.

В режиме глубокого анализа можно ставить более сложные задачи. Например: сначала попросить модель описать изображение, а затем — сгенерировать промт для создания аналогичного изображения.

Другой пример запроса: «Проанализируй скриншот интерфейса и напиши HTML-код для аналогичной страницы».

Если режим отсутствует, в настоящее время нет возможности включить его вручную. Доступ зависит от этапа тестирования.

Почему это имеет значение? Новый режим позволяет решать задачи, где пользователю легче продемонстрировать изображение, чем составить запрос с нуля. Это может быть скриншот интерфейса, таблица, документ, веб-страница или фотография.

Для DeepSeek это ещё один шаг к созданию мультимодального чат-бота. Сервис начинает обрабатывать не только текст, но и визуальные данные в одном диалоге.

Ранее компания представила ИИ-модели линейки DeepSeek-V4, в которую вошли две MoE-модели: V4-Pro с 1,6 трлн параметров и V4-Flash с 284 млрд параметров.

Итог: DeepSeek начал предоставлять доступ к новому режиму «Распознавание», который добавляет в чат возможность анализа изображений, документов, таблиц и интерфейсов.

Тэги DeepSeek Нейросети

DeepSeek тестирует режим «Распознавание» изображений

Режим «Распознавание» в DeepSeek — как он работает

Как распознать текст на фото с помощью DeepSeek

Популярные новости

OpenAI представила GPT-Live — новую голосовую модель для ChatGPT

RuStore установлен на 3 млн телевизоров в РФ

ИИ «Яндекс Карт» поможет найти места для досуга

ByteDance представила Seedream 5.0 Pro

Meta* выпустила Muse Image для генерации изображений

Последние новости

OpenAI представила GPT-Live — новую голосовую модель для ChatGPT

RuStore установлен на 3 млн телевизоров в РФ

ИИ «Яндекс Карт» поможет найти места для досуга

ByteDance представила Seedream 5.0 Pro

Meta* выпустила Muse Image для генерации изображений

НазадНейросеть Z Image и Z Image Turbo: как скачать, установить и пользоваться бесплатно

ДалееCyberYozh App: обзор прокси-сервиса, где мобильный трафик не заканчивается в самый неподходящий момент

DeepSeek тестирует режим «Распознавание» изображений

Режим «Распознавание» в DeepSeek — как он работает

Как распознать текст на фото с помощью DeepSeek

Популярные новости

Последние новости

НазадНейросеть Z Image и Z Image Turbo: как скачать, установить и пользоваться бесплатно

ДалееCyberYozh App: обзор прокси-сервиса, где мобильный трафик не заканчивается в самый неподходящий момент

Лучшее от AllWeb.ru

«Росатом» модернизирует ИТ-системы Федеральной таможенной службы

Meta* выпустила Muse Image для генерации изображений

Google заблокировала 2,36 млн приложений в Play Store