Skip to main content
ElevenLabs выпустила Eleven V3 — теперь ИИ говорит как живой человек

Стартап ElevenLabs анонсировал новую модель для генерации речи — Eleven V3 (alpha). Это самая выразительная и реалистичная TTS-модель на сегодняшний день: она способна передавать эмоции, интонации, паузы и даже такие нюансы, как шёпот, смех или кашель.

Теперь голоса ИИ звучат действительно естественно — настолько, что их трудно отличить от человеческих.

Читайте также: 6 нейросетей для озвучивания текста голосом

Возможности Eleven V3

ИИ-озвучка наконец перестала звучать как робот из навигатора. С Eleven V3 можно создавать аудиокниги, озвучивать видео, а также разрабатывать диалоги для игр — и всё это с необходимым настроением и живыми эмоциями.

Подробности:

  • В тексте теперь можно задавать тон и эмоции с помощью специальных тегов: [sad], [excited], [angry], [whispers], [coughs] и т.д.
  • Модель генерирует сразу два варианта фразы для выбора наиболее удачного.
  • Появился полноценный диалоговый режим: можно создавать сцену с несколькими голосами, без ограничений по количеству спикеров.
  • Поддерживается более 70 языков, в том числе русский.
  • Новая модель доступна даже для бесплатных пользователей. Весь июнь генерации на V3 расходуют всего 20% кредитов — это десятки минут звука без дополнительных затрат.

Как использовать: Eleven V3 — это наиболее выразительная модель генерации речи. Однако для достижения нужного звучания важно уметь правильно ей «подсказывать». Вот что следует учитывать.

Выбирайте подходящий голос: если вам нужен шёпот — не выбирайте голос, обученный на крике.

Как выбрать голос

Нажав на голос, вы сможете увидеть его детальное описание:

Описание голоса

Настройте уровень стабильности — переместите ползунок в нужное положение:

  • Creative — больше эмоций, но могут быть ошибки.
  • Natural — баланс между выразительностью и точностью.
  • Reliable — более стабильный, но хуже реагирует на теги.

Стабильность голоса

Используйте аудиотеги: [laughs], [whispers], [angry], [sigh], [sarcastic], [gunshot], [applause], [strong French accent] и другие. Не забывайте о пунктуации — точки, паузы и заглавные буквы влияют на ритм и интонацию.

Аудиотеги ElevenLabs

Пример: [whispers] I never knew it could be this way… [sigh] But I’m glad we’re here.

Попробовать можно уже сейчас — модель доступна в интерфейсе ElevenLabs.

Ранее ChatGPT научился читать документы из Google Диска.

Close Menu
Новости интернет маркетинга, сайтов, новости нейросетей и технологий