Audiobox: la asombrosa IA de Meta para clonar voces

caja de audio

Meta ha conseguido asombrar a todo el mundo con su proyecto Audiobox, una inteligencia artificial generativa capaz de reproducir una voz humana a partir de unos segundos de audio. No es uno de esos proyectos que quedan muy bien sobre el papel y que después quedan en nada, porque el anuncio ha venido acompañado de una demostración pública de estas capacidades.

Además de voces, Audiobox también puede generar sonidos únicos a través de indicaciones de voz o texto. En este post te contamos todo lo que se sabe hasta ahora de este proyecto y, lo mejor de todo, cómo puedes probarlo tú mismo.

¿Qué es Audiobox?

Audiobox es el nombre elegido para designar el modelo de búsqueda fundamental de Meta para la generación de audio. La creación de audios personalizados, que se puede aplicar en diversas situaciones y escenarios, es el resultado de combinar entradas de voz e indicaciones de texto en lenguaje natural.

Según ha explicado Meta a través de un comunicado, este es el fruto de muchos esfuerzos y años de investigación. Y solo la primera piedra de todo un nuevo mundo de posibilidades que se abre ante nosotros.

La importancia de este lanzamiento no solo hay que valorarla en el «qué», sino en quién está detrás del proyecto. No hay que olvidar que Meta es la compañía que controla algunas de las apps más usadas de España, como Facebook, Instagram o WhatsApp. Eso abre la puerta a que en un plazo de tiempo no muy largo acabemos viendo implementaciones de esta nueva tecnología en ellas.

¿Qué posibilidades ofrece la IA Audiobox de Meta?

audiobox meta

Audiobox nos trae seis funciones únicas basadas en la inteligencia artificial para la creación y edición de audio. Estos ponen a nuestro alcance una amplia gama de opciones de personalización. Son las siguientes:

  1. Crear audio con nuestra propia voz, tomando como base cualquier breve muestra de audio, incluso de unos pocos segundos de duración. Esta función nos permite crear un discurso que imita el tono y estilo de nuestra propia voz o de la de otra persona.
  2. Voces descritas. El audio se genera a partir de una serie de pautas descritas en un texto. Lo mejor de esto es que hace posible la creación de voces nuevas y únicas.
  3. Voces rediseñadas. La idea es cambiar el tono y el estilo de una voz real mediante una descripción de texto. Podríamos decir que es una combinación de las dos funciones anteriores en pro de un nivel de personalización todavía mayor.
  4. Efectos de sonido. Además de voces, Audiobox de Meta es capaz de generar efectos de sonido a partir de un texto descriptivo.
  5. Editor de audio mágico, una práctica herramienta para eliminar el molesto ruido de fondo de las grabaciones de voz.
  6. Relleno de sonido. Una función a través de la cual sustituir parte de un audio por sonidos nuevos.

Como ves, Audiobox ofrece muchas posibilidades para los profesionales del audio y los creadores de contenido, aunque también es muy interesante para cualquier usuario curioso. De momento, los actores de doblaje pueden estar tranquilos, ya que a la vista de los resultados, las voces generadas por esta IA son todavía un poco robóticas, desprovistas de naturalidad. Sin embargo, es cuestión de tiempo que estos pequeños inconvenientes se acaben superando.

Cómo probar Audiobox

test audiobox

La mejor manera de probar esta nueva tecnología es probarla nosotros mismos. Esto es posible a través de la web demo de Audiobox, creada recientemente, y disponible todavía de forma totalmente gratuita. La forma de probarla es esta: grabar nuestra propia voz (o bien reproducir cualquier otra) y empezar a ensayar con ella. Esta es solo una de las posibilidades que nos ofrece esta tecnología.

Si bien esta página de pruebas está disponible en España, de momento solamente se puede utilizar en inglés, Ese es el idioma que tendremos que manejar para solicitar textos y generar audios. Hemos probado con una de las voces femeninas disponibles con la frase «This is a voice test for the web Movilforum» y este ha sido el resultado:

El mal uso de Audiobox de Meta y otras cuestiones preocupantes

Una de las características más sorprendente de Audiobox de Meta es la capacidad de generar nuestra propia voz a través de esta herramienta de IA. Pero, al mismo tiempo, también genera muchas dudas e incertidumbres, porque sobre ella planea la amenaza de un posible mal uso.

A fin de evitar que esta tecnología sea empleada para cometer fraudes o estafas, Meta requiere la aceptación de una serie de condiciones de uso antes de permitirnos probar esta funcionalidad.

Aparte de esto, los audios generados tiene una especie de «marca de agua» que permite rastrear con precisión su procedencia. En el comunicado de prensa que mencionábamos antes, Meta explica que este distintivo es en realidad una señal que es imperceptible para el oído humano, pero que se puede detectar.


Sé el primero en comentar

Deja tu comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

*

*

  1. Responsable de los datos: Actualidad Blog
  2. Finalidad de los datos: Controlar el SPAM, gestión de comentarios.
  3. Legitimación: Tu consentimiento
  4. Comunicación de los datos: No se comunicarán los datos a terceros salvo por obligación legal.
  5. Almacenamiento de los datos: Base de datos alojada en Occentus Networks (UE)
  6. Derechos: En cualquier momento puedes limitar, recuperar y borrar tu información.