Skip to main content
Что умеет Qwen3-Omni и как ей пользоваться

Alibaba Cloud представила Qwen3-Omni — мультимодальную ИИ-модель нового поколения, которая обрабатывает текст, изображения, аудио и видео, предоставляя ответы как текстом, так и синтезированным голосом.

Этот запуск продолжает серию обновлений от Alibaba: недавно компания анонсировала Qwen Edit Images 2509 для редактирования изображений и Wan2.2-Animate — для создания анимации.

Код и веса доступны на GitHub и Hugging Face под лицензией Apache 2.0, что позволяет их свободное использование в коммерческих проектах. Дополнительные сведения можно найти в материале Postium.

Читайте также: 6 лучших чат-ботов на базе ИИ

Что умеет Qwen3-Omni и как ей пользоваться

Нейросеть Qwen3-Omni стала первой значительной «омни»-моделью с открытыми весами. В отличие от закрытых GPT-4o и Gemini 1.5 Pro, её можно запускать локально или в облаке, дообучать на собственных данных и интегрировать в коммерческие продукты.

Qwen3-Omni можно протестировать прямо сейчас в Qwen Chat, а также скачать из репозиториев GitHub и Hugging Face.

Как включить Qwen3-Omni

Возможности:

  • Аудио: распознаёт и анализирует записи длительностью до 40 минут, поддерживает потоковую транскрибацию и быструю реакцию;
  • Речь: функционирует в режиме голосового общения, синтезирует речь на 10 языках, включая русский;
  • Текст: поддерживает 119 языков, среди которых русский, китайский, английский и арабский;
  • Видео и изображения: извлекает информацию и анализирует контент, но не генерирует медиаданные;
  • Скорость: применяет новый речевой модуль Talker, обеспечивающий низкую задержку в голосовой беседе;
  • Размеры: доступны версии от 1,8B до 72B параметров, также имеются MoE-модели, что делает систему адаптируемой к различным задачам.

Весной Alibaba выпустила семейство Qwen3 — языковые модели с параметрами от 0,5B до 72B. Они быстро завоевали популярность на Hugging Face и оказались в топе загрузок. Новый релиз — это шаг вперёд: компания делает акцент на мультимодальности и доступности технологий.

Ранее вышел Kling AI 2.5 Turbo, который лучше понимает запросы и точнее сохраняет исходный стиль.

Alibaba Qwen Нейросети

Close Menu
Новости интернет маркетинга, сайтов, новости нейросетей и технологий