
Alibaba Cloud представила Qwen3-Omni — мультимодальную ИИ-модель нового поколения, которая обрабатывает текст, изображения, аудио и видео, предоставляя ответы как текстом, так и синтезированным голосом.
Этот запуск продолжает серию обновлений от Alibaba: недавно компания анонсировала Qwen Edit Images 2509 для редактирования изображений и Wan2.2-Animate — для создания анимации.
Код и веса доступны на GitHub и Hugging Face под лицензией Apache 2.0, что позволяет их свободное использование в коммерческих проектах. Дополнительные сведения можно найти в материале Postium.
Читайте также: 6 лучших чат-ботов на базе ИИ
Что умеет Qwen3-Omni и как ей пользоваться
Нейросеть Qwen3-Omni стала первой значительной «омни»-моделью с открытыми весами. В отличие от закрытых GPT-4o и Gemini 1.5 Pro, её можно запускать локально или в облаке, дообучать на собственных данных и интегрировать в коммерческие продукты.
Qwen3-Omni можно протестировать прямо сейчас в Qwen Chat, а также скачать из репозиториев GitHub и Hugging Face.

Возможности:
- Аудио: распознаёт и анализирует записи длительностью до 40 минут, поддерживает потоковую транскрибацию и быструю реакцию;
- Речь: функционирует в режиме голосового общения, синтезирует речь на 10 языках, включая русский;
- Текст: поддерживает 119 языков, среди которых русский, китайский, английский и арабский;
- Видео и изображения: извлекает информацию и анализирует контент, но не генерирует медиаданные;
- Скорость: применяет новый речевой модуль Talker, обеспечивающий низкую задержку в голосовой беседе;
- Размеры: доступны версии от 1,8B до 72B параметров, также имеются MoE-модели, что делает систему адаптируемой к различным задачам.
Весной Alibaba выпустила семейство Qwen3 — языковые модели с параметрами от 0,5B до 72B. Они быстро завоевали популярность на Hugging Face и оказались в топе загрузок. Новый релиз — это шаг вперёд: компания делает акцент на мультимодальности и доступности технологий.
Ранее вышел Kling AI 2.5 Turbo, который лучше понимает запросы и точнее сохраняет исходный стиль.


