Skip to main content
Вышла Octave 2 от Hume AI

Компания Hume AI представила второе поколение своей системы синтеза речи — Octave 2. Модель звучит настолько естественно, что умеет шептать, подражать акцентам, передавать эмоции и даже запоминать разговорные выражения.

Работает на 11 языках, включая русский, и генерирует голос с задержкой менее 200 миллисекунд. Подробности в материале Postium.

Читайте также: 6 лучших нейросетей для озвучки текста голосом

Что умеет Octave 2 и как ей пользоваться

Octave 2 может создавать голос с нуля или клонировать существующий по короткому аудиосэмплу. Пользователь задаёт нужный стиль голосом — «спокойно», «саркастично», «взволнованно» или даже «шепчи испуганно» — и получает реалистичное аудио без дополнительного монтажа.

Ещё одна новая возможность — точечная правка произношения: можно менять акценты или длительность звуков для отдельных слов.

Среди других функций — voice conversion (замена голоса при сохранении ритма речи) и интонационное управление: можно передавать настроение и тембр прямо через текстовую подсказку. Это делает Octave 2 особенно полезным для озвучки подкастов, дубляжа, аудиокниг и видео.

Как пользоваться:

  1. Перейдите на сайт Hume AI и откройте раздел Playground.
  2. В колонке справа выберите модель Octave 2.
  3. Введите текст или загрузите короткий аудиофайл, если хотите клонировать голос.
  4. Укажите эмоцию или стиль речи — например, calm, whisper fearfully, excited или sarcastic.
  5. Нажмите Generate — через несколько секунд появится готовая аудиозапись, которую можно скачать или использовать через API.

Как пользоваться Octave 2

В бесплатной версии доступно до 10 минут генерации речи в месяц, после чего можно перейти на платные тарифы от $3 в месяц с увеличенными лимитами.

Первая версия Octave вышла в начале 2025 года и уже тогда выделялась тем, что «понимает смысл фразы» и подбирает интонацию под контекст. В Octave 2 разработчики пошли дальше: добавили мультиъязычность, эмоциональную вариативность и точный контроль над звучанием — шаг к действительно «осмысленной речи» от ИИ.

Ранее в приложении Шедеврум появилась модель для генерации видео Wan 2.2.

Нейросети

Close Menu
Новости интернет маркетинга, сайтов, новости нейросетей и технологий