Компания Hume AI представила второе поколение своей системы синтеза речи — Octave 2. Модель звучит настолько естественно, что умеет шептать, подражать акцентам, передавать эмоции и даже запоминать разговорные выражения.
Работает на 11 языках, включая русский, и генерирует голос с задержкой менее 200 миллисекунд. Подробности в материале Postium.
Читайте также: 6 лучших нейросетей для озвучки текста голосом
Что умеет Octave 2 и как ей пользоваться
Octave 2 может создавать голос с нуля или клонировать существующий по короткому аудиосэмплу. Пользователь задаёт нужный стиль голосом — «спокойно», «саркастично», «взволнованно» или даже «шепчи испуганно» — и получает реалистичное аудио без дополнительного монтажа.
Ещё одна новая возможность — точечная правка произношения: можно менять акценты или длительность звуков для отдельных слов.
Среди других функций — voice conversion (замена голоса при сохранении ритма речи) и интонационное управление: можно передавать настроение и тембр прямо через текстовую подсказку. Это делает Octave 2 особенно полезным для озвучки подкастов, дубляжа, аудиокниг и видео.
Как пользоваться:
- Перейдите на сайт Hume AI и откройте раздел Playground.
- В колонке справа выберите модель Octave 2.
- Введите текст или загрузите короткий аудиофайл, если хотите клонировать голос.
- Укажите эмоцию или стиль речи — например, calm, whisper fearfully, excited или sarcastic.
- Нажмите Generate — через несколько секунд появится готовая аудиозапись, которую можно скачать или использовать через API.

В бесплатной версии доступно до 10 минут генерации речи в месяц, после чего можно перейти на платные тарифы от $3 в месяц с увеличенными лимитами.
Первая версия Octave вышла в начале 2025 года и уже тогда выделялась тем, что «понимает смысл фразы» и подбирает интонацию под контекст. В Octave 2 разработчики пошли дальше: добавили мультиъязычность, эмоциональную вариативность и точный контроль над звучанием — шаг к действительно «осмысленной речи» от ИИ.
Ранее в приложении Шедеврум появилась модель для генерации видео Wan 2.2.


