
Стартап ElevenLabs анонсировал новую модель для генерации речи — Eleven V3 (alpha). Это самая выразительная и реалистичная TTS-модель на сегодняшний день: она способна передавать эмоции, интонации, паузы и даже такие нюансы, как шёпот, смех или кашель.
Теперь голоса ИИ звучат действительно естественно — настолько, что их трудно отличить от человеческих.
Читайте также: 6 нейросетей для озвучивания текста голосом
Возможности Eleven V3
ИИ-озвучка наконец перестала звучать как робот из навигатора. С Eleven V3 можно создавать аудиокниги, озвучивать видео, а также разрабатывать диалоги для игр — и всё это с необходимым настроением и живыми эмоциями.
Подробности:
- В тексте теперь можно задавать тон и эмоции с помощью специальных тегов: [sad], [excited], [angry], [whispers], [coughs] и т.д.
- Модель генерирует сразу два варианта фразы для выбора наиболее удачного.
- Появился полноценный диалоговый режим: можно создавать сцену с несколькими голосами, без ограничений по количеству спикеров.
- Поддерживается более 70 языков, в том числе русский.
- Новая модель доступна даже для бесплатных пользователей. Весь июнь генерации на V3 расходуют всего 20% кредитов — это десятки минут звука без дополнительных затрат.
Как использовать: Eleven V3 — это наиболее выразительная модель генерации речи. Однако для достижения нужного звучания важно уметь правильно ей «подсказывать». Вот что следует учитывать.
Выбирайте подходящий голос: если вам нужен шёпот — не выбирайте голос, обученный на крике.

Нажав на голос, вы сможете увидеть его детальное описание:

Настройте уровень стабильности — переместите ползунок в нужное положение:
- Creative — больше эмоций, но могут быть ошибки.
- Natural — баланс между выразительностью и точностью.
- Reliable — более стабильный, но хуже реагирует на теги.

Используйте аудиотеги: [laughs], [whispers], [angry], [sigh], [sarcastic], [gunshot], [applause], [strong French accent] и другие. Не забывайте о пунктуации — точки, паузы и заглавные буквы влияют на ритм и интонацию.

Пример: [whispers] I never knew it could be this way… [sigh] But I’m glad we’re here.
Попробовать можно уже сейчас — модель доступна в интерфейсе ElevenLabs.
Ранее ChatGPT научился читать документы из Google Диска.

