Audiobox: IA uimitoare a lui Meta pentru a clona voci

caseta audio

meta A reușit să uimească pe toată lumea cu proiectul său Audiobox, o inteligență artificială generativă capabilă să reproducă o voce umană din câteva secunde de sunet. Nu este unul dintre acele proiecte care arată foarte bine pe hârtie și apoi ajung la nimic, pentru că anunțul a fost însoțit de o demonstrație publică a acestor capacități.

Pe lângă voci, Audiobox poate genera și sunete unice prin mesaje vocale sau text. În această postare vă spunem tot ce se știe până acum despre acest proiect și, cel mai bine, cum îl puteți încerca singur.

Ce este Audiobox?

Audiobox este numele ales pentru a desemna modelul fundamental de căutare pentru Meta generare audio. Crearea de sunet personalizat, care poate fi aplicat în diverse situații și scenarii, este rezultatul combinării introducerii vocale și a instrucțiunilor text în limbaj natural.

După cum a explicat Meta printr-o declarație, acesta este rodul multor eforturi și ani de cercetare. Și doar prima piatră a unei lumi cu totul noi de posibilități care se deschide în fața noastră.

Importanța acestei lansări nu trebuie apreciată doar în „ce”, ci și în cine se află în spatele proiectului. Nu trebuie să uităm asta Meta este compania care controlează unele dintre cele mai utilizate aplicații din Spania, precum Facebook, Instagram sau WhatsApp. Acest lucru deschide ușa pentru a vedea implementări ale acestei noi tehnologii în ele într-o perioadă nu prea lungă de timp.

Ce posibilități oferă Meta Audiobox AI?

meta caseta audio

Audiobox ne aduce șase funcții unice bazat pe inteligența artificială pentru crearea și editarea audio. Acestea pun la dispoziție o gamă largă de opțiuni de personalizare. Acestea sunt următoarele:

  1. Creați sunet cu propria noastră voce, pe baza oricărei mostre audio scurte, chiar și de câteva secunde. Această funcție ne permite să creăm un discurs care imită tonul și stilul propriei voci sau ale unei alte persoane.
  2. Voci descrise. Audio este generat dintr-o serie de linii directoare descrise într-un text. Cel mai bun lucru este că face posibilă crearea de voci noi și unice.
  3. Voci reproiectate. Ideea este de a schimba tonul și stilul unei voci reale folosind o descriere text. Am putea spune că este o combinație a celor două funcții anterioare în favoarea unui nivel și mai ridicat de personalizare.
  4. Efecte sonore. Pe lângă voci, Audiobox by Meta este capabil să genereze efecte sonore din text descriptiv.
  5. editor audio magic, un instrument la îndemână pentru a elimina zgomotul de fond enervant din înregistrările vocale.
  6. umplere cu sunet. O funcție prin care să înlocuiți o parte dintr-un sunet cu sunete noi.

După cum vedeți, Audiobox oferă multe posibilități pentru profesioniștii audio și creatorii de conținut, deși este foarte interesant și pentru orice utilizator curios. Deocamdată, actorii vocali pot fi liniștiți, deoarece având în vedere rezultatele, Vocile generate de acest AI sunt încă puțin robotizate, lipsite de naturalețe. Cu toate acestea, este o chestiune de timp până când aceste mici inconveniente să fie depășite.

Cum să încerci Audiobox

test audiobox

Cel mai bun mod de a testa această nouă tehnologie este să o încercăm noi înșine. Acest lucru este posibil prin intermediul demonstrație web Caseta audio, creat recent și disponibil în continuare complet gratuit. Modul de a încerca este următorul: înregistrăm propria noastră voce (sau cântați oricare alta) și începeți să repetiți cu ea. Aceasta este doar una dintre posibilitățile pe care ni le oferă această tehnologie.

Deși această pagină de testare este disponibilă în Spania, în acest moment poate fi folosit numai în engleză, Acesta este limbajul pe care va trebui să îl folosim pentru a solicita texte și a genera audio. Am încercat una dintre vocile feminine disponibile cu fraza „Acesta este un test de voce pentru web Movilforum» si acesta a fost rezultatul:

Folosirea greșită a casetei audio a lui Meta și alte probleme îngrijorătoare

Una dintre cele mai surprinzătoare caracteristici ale Audiobox-ului Meta este capacitatea de a ne genera propria voce prin acest instrument AI. Dar, în același timp, generează și multe îndoieli și incertitudini, pentru că despre asta planifică amenințarea unei posibile utilizări greșite.

Pentru a preveni folosirea acestei tehnologii comite fraude sau escrocherii, Meta necesită acceptarea unui număr de termeni de utilizare înainte de a ne permite să testăm această funcționalitate.

În afară de aceasta, audio-urile generate au un fel de „filigran” care permite urmărirea cu precizie a originii lor. În comunicatul de presă pe care l-am menționat anterior, Meta explică că acest distinctiv este de fapt un semnal care este imperceptibil pentru urechea umană, dar poate fi detectat.


Lasă comentariul tău

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

*

*

  1. Responsabil pentru date: Actualidad Blog
  2. Scopul datelor: Control SPAM, gestionarea comentariilor.
  3. Legitimare: consimțământul dvs.
  4. Comunicarea datelor: datele nu vor fi comunicate terților decât prin obligație legală.
  5. Stocarea datelor: bază de date găzduită de Occentus Networks (UE)
  6. Drepturi: în orice moment vă puteți limita, recupera și șterge informațiile.