Audiobox: niesamowita sztuczna inteligencja Meta do klonowania głosów

skrzynka audio

Meta Udało mu się zadziwić wszystkich swoim projektem Audiobox, generatywna sztuczna inteligencja zdolna do odtwarzania ludzkiego głosu z kilku sekund dźwięku. To nie jest jeden z tych projektów, które wyglądają bardzo dobrze na papierze, a potem nic nie dają, bo zapowiedzi towarzyszyła publiczna demonstracja tych możliwości.

Oprócz głosów Audiobox może także generować unikalne dźwięki za pomocą komunikatów głosowych lub tekstowych. W tym poście opowiemy Ci wszystko, co dotychczas wiadomo na temat tego projektu, a co najważniejsze, jak możesz sam go wypróbować.

Co to jest Audiobox?

Audiobox to nazwa wybrana do określenia podstawowego modelu wyszukiwania Meta generowanie dźwięku. Tworzenie spersonalizowanego dźwięku, który można zastosować w różnych sytuacjach i scenariuszach, jest wynikiem połączenia wprowadzania głosowego i podpowiedzi tekstowych w języku naturalnym.

Jak wyjaśniła Meta w oświadczeniu, jest to owoc wielu wysiłków i lat badań. A dopiero pierwszy kamień całkiem nowego świata możliwości, jaki się przed nami otwiera.

Znaczenie tego uruchomienia należy oceniać nie tylko pod kątem tego, „co”, ale także tego, kto stoi za projektem. Nie wolno nam o tym zapominać Meta to firma kontrolująca niektóre z najczęściej używanych aplikacji w Hiszpanii, takie jak Facebook, Instagram czy WhatsApp. Otwiera to drzwi do zobaczenia w nich wdrożeń tej nowej technologii w niezbyt długim czasie.

Jakie możliwości oferuje Meta Audiobox AI?

meta audioboxa

Audiobox przynosi nam sześć unikalnych funkcji na podstawie sztuczna inteligencja do tworzenia i edycji dźwięku. Dzięki temu mamy do dyspozycji szeroką gamę opcji dostosowywania. Są to:

  1. Twórz dźwięk własnym głosem, na podstawie dowolnej krótkiej próbki audio, nawet kilkusekundowej. Dzięki tej funkcji możemy stworzyć mowę imitującą ton i styl naszego głosu lub głosu innej osoby.
  2. Opisano głosy. Dźwięk jest generowany na podstawie szeregu wskazówek opisanych w tekście. Najlepsze w tym jest to, że umożliwia tworzenie nowych i niepowtarzalnych głosów.
  3. Przeprojektowane głosy. Pomysł polega na zmianie tonu i stylu prawdziwego głosu za pomocą opisu tekstowego. Można powiedzieć, że jest to połączenie dwóch poprzednich funkcji na rzecz jeszcze wyższego poziomu personalizacji.
  4. Efekty dźwiękowe. Oprócz głosów Audiobox firmy Meta jest w stanie generować efekty dźwiękowe z tekstu opisowego.
  5. magiczny edytor audio, przydatne narzędzie do usuwania irytujących szumów tła z nagrań głosowych.
  6. wypełnienie dźwiękiem. Funkcja, za pomocą której można zastąpić część dźwięku nowe dźwięki.

Jak widać, Audiobox oferuje wiele możliwości dla profesjonalistów audio i twórców treści, chociaż jest to również bardzo interesujące dla każdego ciekawskiego użytkownika. Na razie aktorzy głosowi mogą być spokojni, gdyż biorąc pod uwagę wyniki, Głosy generowane przez tę sztuczną inteligencję są nadal nieco zrobotyzowane, pozbawione naturalności. Jednak pokonanie tych drobnych niedogodności jest kwestią czasu.

Jak wypróbować Audiobox

test audioboxu

Najlepszym sposobem przetestowania tej nowej technologii jest wypróbowanie jej samodzielnie. Jest to możliwe poprzez demonstracja internetowa Audiobox, stworzony niedawno i nadal dostępny całkowicie bezpłatnie. Spróbować tego można w następujący sposób: nagraj własny głos (lub zagraj inny) i rozpocznij z nim próby. To tylko jedna z możliwości, jakie oferuje nam ta technologia.

Chociaż ta strona testowa jest obecnie dostępna w Hiszpanii można używać wyłącznie w języku angielskim, To jest język, którego będziemy musieli używać do żądania tekstów i generowania plików audio. Wypróbowaliśmy jeden z głosów żeńskich dostępnych w tej frazie «To jest test głosu dla sieci Movilforum» i oto rezultat:

Niewłaściwe użycie Audioboksa Meta i inne niepokojące problemy

Jedną z najbardziej zaskakujących funkcji Meta Audiobox jest możliwość generowania własnego głosu za pomocą tego narzędzia AI. Ale jednocześnie rodzi też wiele wątpliwości i niepewności, bo o tym planuje zagrożenie możliwym nadużyciem.

Aby zapobiec przyzwyczajeniu się do tej technologii popełniać oszustwa lub oszustwa, Meta wymaga zaakceptowania szeregu warunków użytkowania, zanim umożliwi nam przetestowanie tej funkcjonalności.

Poza tym wygenerowane pliki audio posiadają swego rodzaju „znak wodny”, który pozwala na dokładne prześledzenie ich pochodzenia. We wspomnianej wcześniej notatce prasowej Meta wyjaśnia, że ​​ta cecha charakterystyczna jest w rzeczywistości sygnałem niedostrzegalnym dla ludzkiego ucha, ale możliwym do wykrycia.


Zostaw swój komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

*

*

  1. Odpowiedzialny za dane: Actualidad Blog
  2. Cel danych: kontrola spamu, zarządzanie komentarzami.
  3. Legitymacja: Twoja zgoda
  4. Przekazywanie danych: Dane nie będą przekazywane stronom trzecim, z wyjątkiem obowiązku prawnego.
  5. Przechowywanie danych: baza danych hostowana przez Occentus Networks (UE)
  6. Prawa: w dowolnym momencie możesz ograniczyć, odzyskać i usunąć swoje dane.