Audiobox: потрясающий искусственный интеллект Meta для клонирования голосов

Мета Ему удалось поразить всех своим проектом. Audiobox, генеративный искусственный интеллект, способный воспроизводить человеческий голос по нескольким секундам звука.. Это не из тех проектов, которые на бумаге выглядят очень хорошо, а потом сходят на нет, потому что анонс сопровождался публичной демонстрацией этих возможностей.

Помимо голосов, Audiobox также может генерировать уникальные звуки с помощью голосовых или текстовых подсказок. В этом посте мы расскажем вам все, что на данный момент известно об этом проекте, а главное, как вы можете попробовать его самостоятельно.

Что такое Аудиобокс?

Audiobox — это название, выбранное для обозначения фундаментальной модели поиска Meta для генерация звука. Создание персонализированного аудио, которое можно применять в различных ситуациях и сценариях, является результатом объединения голосового ввода и текстовых подсказок на естественном языке.

Как объяснила Мета в своем заявлении, это результат многих усилий и многолетних исследований. И только первый камень совершенно нового мира возможностей, который открывается перед нами.

Важность этого запуска надо оценивать не только по тому «что», но и по тому, кто стоит за проектом. Мы не должны забывать об этом Meta — компания, которая контролирует некоторые из наиболее часто используемых приложений в Испании, такие как Facebook, Instagram или WhatsApp.. Это открывает возможность увидеть в них реализацию этой новой технологии в не слишком продолжительном периоде времени.

Какие возможности предлагает Meta Audiobox AI?

Аудиобокс приносит нам шесть уникальных функций на основе искусственный интеллект для создания и редактирования аудио. Они предоставляют в наше распоряжение широкий спектр возможностей настройки. Они следующие:

Создавайте аудио своим собственным голосом, на основе любого короткого аудиосэмпла, даже продолжительностью в несколько секунд. Эта функция позволяет нам создавать речь, имитирующую тон и стиль нашего собственного голоса или голоса другого человека.
Описаны голоса. Аудио создается на основе ряда рекомендаций, описанных в тексте. Самое лучшее в этом то, что это позволяет создавать новые и уникальные голоса.
Переработанные голоса. Идея состоит в том, чтобы изменить тон и стиль реального голоса с помощью текстового описания. Можно сказать, что это комбинация двух предыдущих функций в пользу еще более высокого уровня настройки.
Звуковые эффекты. Помимо голосов, Audiobox от Meta способен генерировать звуковые эффекты из описательного текста.
волшебный аудиоредактор, удобный инструмент для удаления раздражающего фонового шума из голосовых записей.
звуковое наполнение. Функция, с помощью которой можно заменить часть аудио на новые звуки.

Как видите, Audiobox предлагает множество возможностей для профессионалов в области аудио и создателей контента, хотя для любого любознательного пользователя это тоже очень интересно. На данный момент актеры озвучивания могут быть уверены, поскольку, учитывая результаты, Голоса, генерируемые этим ИИ, все еще немного роботизированы, лишены естественности.. Однако преодоление этих небольших неудобств — вопрос времени.

Как попробовать Аудиобокс

Лучший способ протестировать эту новую технологию — попробовать ее самостоятельно. Это возможно через веб-демо Аудиобокс, созданный недавно и до сих пор доступный совершенно бесплатно. Способ попробовать такой: записать свой голос (или сыграть любой другой) и начать с ним репетировать. Это лишь одна из возможностей, которые предлагает нам эта технология.

Хотя эта тестовая страница доступна в Испании, на данный момент можно использовать только на английском языке, Это язык, который нам придется использовать для запроса текста и создания аудио. Мы попробовали один из женских голосов, доступных с фразой «Это голосовой тест для сети Movilforum» и вот результат:

Неправильное использование аудиобокса Meta и другие тревожные проблемы

Одной из самых удивительных особенностей Meta Audiobox является возможность генерировать собственный голос с помощью этого инструмента искусственного интеллекта. Но, в то же время, оно порождает и множество сомнений и неуверенности, поскольку по этому поводу планирует угрозу возможного неправильного использования.

Чтобы предотвратить использование этой технологии для совершать мошенничества или мошенничества, Meta требует принятия ряда условий использования, прежде чем мы сможем протестировать эту функцию.

Помимо этого, сгенерированные аудио имеют своего рода «водяной знак», который позволяет точно отследить их происхождение. В пресс-релизе, о котором мы упоминали ранее, Мета объясняет, что этот отличительный признак на самом деле является сигналом, который незаметен для человеческого уха, но может быть обнаружен.

Оставьте свой комментарий Отменить ответ

Ваш электронный адрес не будет опубликован. Обязательные для заполнения поля помечены *

комментарий *

Имя*

Электронная почта*

Принять условия конфиденциальности*

Ответственный за данные: Блог Actualidad
Назначение данных: контроль спама, управление комментариями.
Легитимация: ваше согласие
Передача данных: данные не будут переданы третьим лицам, кроме как по закону.
Хранение данных: база данных, размещенная в Occentus Networks (ЕС)
Права: в любое время вы можете ограничить, восстановить и удалить свою информацию.

Я хочу получать рассылку новостей