Alibaba выпустила Qwen3-Omni — нейросеть для работы с текстом, видео и изображениями

Что умеет Qwen3-Omni и как ей пользоваться

Alibaba Cloud представила Qwen3-Omni — мультимодальную ИИ-модель нового поколения, которая обрабатывает текст, изображения, аудио и видео, предоставляя ответы как текстом, так и синтезированным голосом.

Этот запуск продолжает серию обновлений от Alibaba: недавно компания анонсировала Qwen Edit Images 2509 для редактирования изображений и Wan2.2-Animate — для создания анимации.

Код и веса доступны на GitHub и Hugging Face под лицензией Apache 2.0, что позволяет их свободное использование в коммерческих проектах. Дополнительные сведения можно найти в материале Postium.

Читайте также: 6 лучших чат-ботов на базе ИИ

Что умеет Qwen3-Omni и как ей пользоваться

Нейросеть Qwen3-Omni стала первой значительной «омни»-моделью с открытыми весами. В отличие от закрытых GPT-4o и Gemini 1.5 Pro, её можно запускать локально или в облаке, дообучать на собственных данных и интегрировать в коммерческие продукты.

Qwen3-Omni можно протестировать прямо сейчас в Qwen Chat, а также скачать из репозиториев GitHub и Hugging Face.

Как включить Qwen3-Omni

Возможности:

Аудио: распознаёт и анализирует записи длительностью до 40 минут, поддерживает потоковую транскрибацию и быструю реакцию;
Речь: функционирует в режиме голосового общения, синтезирует речь на 10 языках, включая русский;
Текст: поддерживает 119 языков, среди которых русский, китайский, английский и арабский;
Видео и изображения: извлекает информацию и анализирует контент, но не генерирует медиаданные;
Скорость: применяет новый речевой модуль Talker, обеспечивающий низкую задержку в голосовой беседе;
Размеры: доступны версии от 1,8B до 72B параметров, также имеются MoE-модели, что делает систему адаптируемой к различным задачам.

Весной Alibaba выпустила семейство Qwen3 — языковые модели с параметрами от 0,5B до 72B. Они быстро завоевали популярность на Hugging Face и оказались в топе загрузок. Новый релиз — это шаг вперёд: компания делает акцент на мультимодальности и доступности технологий.

Ранее вышел Kling AI 2.5 Turbo, который лучше понимает запросы и точнее сохраняет исходный стиль.

Тэги Alibaba Qwen Нейросети

Alibaba выпустила Qwen3-Omni — нейросеть для работы с текстом, видео и изображениями

Что умеет Qwen3-Omni и как ей пользоваться

Популярные новости

Багажная система Шереметьево переведена на российское ПО

В «Яндекс Картах» запустили режим «По шагам»

SimpleOne: каждая пятая компания в РФ ведет учет ИТ-активов в Excel

PlatformCraft запускает холодное объектное хранилище

ChatGPT добавил интеграцию с Runway — видео можно будет генерировать прямо в чате

Последние новости

Багажная система Шереметьево переведена на российское ПО

В «Яндекс Картах» запустили режим «По шагам»

SimpleOne: каждая пятая компания в РФ ведет учет ИТ-активов в Excel

PlatformCraft запускает холодное объектное хранилище

ChatGPT добавил интеграцию с Runway — видео можно будет генерировать прямо в чате

Назад«Аэроэкспресс» запустил PWA-приложение

Далее«Крайон» сделал HScan платформой для управления уязвимостями

Alibaba выпустила Qwen3-Omni — нейросеть для работы с текстом, видео и изображениями

Что умеет Qwen3-Omni и как ей пользоваться

Популярные новости

Последние новости

Назад«Аэроэкспресс» запустил PWA-приложение

Далее«Крайон» сделал HScan платформой для управления уязвимостями

Лучшее от AllWeb.ru

Microsoft выпустит игру про Индиану Джонса для PS5

VK отчиталась за первый квартал 2026 года — выручка выросла на 6%

Госуслуги в ближайшее время будут интегрированы в MAX