Skip to main content
Что умеет нейросеть Audio2Face

Nvidia открыла исходный код Audio2Face — AI-модели, которая генерирует мимику и синхронные движения губ для 3D-персонажей на основе аудиозаписей.

Компания предоставила в открытом доступе модели, SDK и фреймворк для обучения, что позволит разработчикам адаптировать систему для различных языков, стилей анимации и специфических задач — от игр до приложений с виртуальными собеседниками.

Читайте также: Бесплатные нейросети для озвучивания текста голосом

Что умеет нейросеть Audio2Face и где скачать исходный код

Модель анализирует «акустические характеристики» речи — фонемы, интонации, акценты — и преобразует их в анимационные данные. Эти данные автоматически сопоставляются с параметрами лица (blendshapes) аватара, обеспечивая реалистичный липсинк и базовую мимику.

Что умеет нейросеть Audio2Face

Nvidia подчеркивает, что инструмент подходит как для заранее записанного контента (видео, катсцены), так и для живых выступлений и стримов.

В комплект входят:

  • SDK и плагины для интеграции в игровые движки, включая Unreal Engine 5 и работу с MetaHumans;
  • фреймворк для обучения, позволяющий дообучать модель, например, для поддержки специфических языков или уникального стиля артикуляции;
  • дополнительные модули, такие как Audio2Emotion, которые анализируют эмоциональную окраску голоса и добавляют выразительность лицу персонажа.

Кто уже использует

Audio2Face применяется в реальных проектах: например, разработчики внедрили его в игру Alien: Rogue Incursion Evolved Edition. Технология способствует ускорению подготовки катсцен и делает речь персонажей более естественной.

Audio2Face — составная часть платформы ACE (Avatar Cloud Engine), которую Nvidia развивает для игр, приложений и сервисов с виртуальными персонажами. Компания надеется, что открытие кода привлечет больше разработчиков и укрепит экосистему. Тем не менее, важно отметить, что хотя проект доступен всем, оптимальная производительность достигается на GPU Nvidia, что сохраняет «привязку» к их оборудованию.

Исходные коды и примеры уже опубликованы на GitHub и доступны разработчикам по всему миру. Инструмент можно использовать бесплатно, модифицировать под свои задачи и интегрировать в существующие пайплайны.

Ранее Nvidia объявила о намерении инвестировать до $100 миллиардов в OpenAI.

NVIDIA Нейросети

Close Menu
Новости интернет маркетинга, сайтов, новости нейросетей и технологий