ИИ заговорил в ElevenLabs любым голосом на разных языках
Создание инструмента, который делает контент доступным на любом языке и любым голосом, — благородная миссия. Именно ей посвящен стартап ElevenLabs, который уже больше года изучает возможности голосового искусственного интеллекта.
Наша миссия — сделать реальностью поддержку многоязычного аудио по запросу в сфере образования, потокового вещания, аудиокниг, игр, фильмов и даже разговоров в реальном времени. Наши исследования обеспечивают не только текущие функции платформы, но и способствуют реализации нашей конечной цели — мгновенного преобразования разговорного звука между языками, — говорится на сайте проекта.
ElevenLab изучает возможности голосового искусственного интеллекта Источник: https://elevenlabs.io/
Стартап ElevenLabs в 2022 году запустили лучшие друзья — Петр, бывший инженер по машинному обучению в Google, и Мати, в прошлом — стратег по развертыванию в Palantir Technologies. К решительным действиям их сподвиг низкокачественный польский дубляж голливудских фильмов.
Компания, оцененная в $100 млн, уже завершила раунд финансирования серии А на сумму $19 млн, который возглавляли Нат Фридман (ex-GitHub), Даниэль Гросс (ex-Y Combinator) и венчурный фонд Andreessen Horowitz. Среди инвесторов проекта — венчурные компании Credo Ventures и Concept Ventures, соучредители Instagram, Oculus VR, Deepmind & Inflection и Perplexity AI.
На что способен голосовой искусственный интеллект?
Команда ElevenLabs работает над созданием универсального, реалистичного и контентозависимого голосового искусственного интеллекта, который способен генерировать речь на более чем 30 языках сотнями существующих и сгенерированных голосов.
Модель ElevenLabs — это не просто генератор голоса, а инструмент, понимающий стоящие за текстом логику и эмоции. Он контекстуально связывает все элементы повествования и обеспечивает аутентичную интонацию, благодаря чему для пользователей речь звучит максимально естественно. При этом создатели особое внимание уделяют этической составляющей исследований: они внедряют меры, позволяющие соблюдать права интеллектуальной собственности и препятствовать неправомерному использованию голосового ИИ.
Как создавать разговорную речь в ElevenLabs Источник: https://elevenlabs.io/
Для работы с голосовым искусственным интеллектом нужно зарегистрироваться на платформе, выбрать бесплатную или платную версию и выполнить следующие действия:
- выбрать подходящий голос и отредактировать настройки;
- ввести текст, который нужно трансформировать в речь, на любом из поддерживаемых языков;
- сгенерировать речь в формате загружаемых аудиофайлов и оценить результат.
Также среди доступных продуктов ElevenLabs — голосовая лаборатория для создания новых синтетических и клонирования существующих голосов, голосовая библиотека с сотнями синтетических голосов, созданных пользователями, и рабочая станция для редактирования параметров речи. До конца 2023 года компания планирует представить еще один долгожданный инструмент — искусственный дубляж, который сможет озвучивать любой аудио- или видеоконтент на другом языке, при этом сохраняя голос оригинального исполнителя.
В настоящее время ElevenLabs поддерживает 28 языков: от английского, немецкого и французского до украинского, финского, румынского и корейского. Среди самых популярных вариантов использования голосового искусственного интеллекта — озвучка видеороликов, игр, аудиокниг и чат-ботов.