ऑडियोबॉक्स: आवाज़ों को क्लोन करने के लिए मेटा का अद्भुत AI

ऑडियो बॉक्स

मेटा वह अपने प्रोजेक्ट से सभी को आश्चर्यचकित करने में कामयाब रहे हैं ऑडियोबॉक्स, एक जनरेटिव कृत्रिम बुद्धिमत्ता जो कुछ सेकंड के ऑडियो से मानव आवाज को पुन: उत्पन्न करने में सक्षम है. यह उन परियोजनाओं में से एक नहीं है जो कागज पर बहुत अच्छी लगती हैं और फिर बेकार हो जाती हैं, क्योंकि घोषणा के साथ इन क्षमताओं का सार्वजनिक प्रदर्शन भी किया गया है।

आवाजों के अलावा, ऑडियोबॉक्स आवाज या पाठ संकेतों के माध्यम से अद्वितीय ध्वनियां भी उत्पन्न कर सकता है। इस पोस्ट में हम आपको वह सब कुछ बताएंगे जो इस परियोजना के बारे में अब तक ज्ञात है और सबसे अच्छी बात यह है कि आप इसे स्वयं कैसे आज़मा सकते हैं।

ऑडियोबॉक्स क्या है?

ऑडियोबॉक्स वह नाम है जिसे मेटा के मौलिक खोज मॉडल को नामित करने के लिए चुना गया है ऑडियो पीढ़ी. वैयक्तिकृत ऑडियो का निर्माण, जिसे विभिन्न स्थितियों और परिदृश्यों में लागू किया जा सकता है, प्राकृतिक भाषा में ध्वनि इनपुट और टेक्स्ट संकेतों के संयोजन का परिणाम है।

जैसा कि मेटा ने एक बयान के माध्यम से बताया, यह कई प्रयासों और वर्षों के शोध का फल है। और संभावनाओं की एक पूरी नई दुनिया का पहला पत्थर जो हमारे सामने खुलता है।

इस लॉन्च के महत्व का मूल्यांकन न केवल "क्या" में किया जाना चाहिए, बल्कि इस परियोजना के पीछे कौन है। हमें यह नहीं भूलना चाहिए मेटा वह कंपनी है जो स्पेन में फेसबुक, इंस्टाग्राम या व्हाट्सएप जैसे कुछ सबसे अधिक उपयोग किए जाने वाले ऐप्स को नियंत्रित करती है. इससे बहुत कम समय में उनमें इस नई तकनीक के कार्यान्वयन को देखने का द्वार खुल जाता है।

मेटा ऑडियोबॉक्स AI क्या संभावनाएं प्रदान करता है?

ऑडियोबॉक्स मेटा

ऑडियोबॉक्स हमें लाता है छह अद्वितीय कार्य पर आधारित कृत्रिम बुद्धि ऑडियो निर्माण और संपादन के लिए. ये हमारे निपटान में अनुकूलन विकल्पों की एक विस्तृत श्रृंखला रखते हैं। वे निम्नलिखित हैं:

  1. अपनी आवाज से ऑडियो बनाएं, किसी भी छोटे ऑडियो नमूने पर आधारित, यहां तक ​​कि कुछ सेकंड लंबा भी। यह फ़ंक्शन हमें एक ऐसा भाषण बनाने की अनुमति देता है जो हमारी अपनी आवाज़ या किसी अन्य व्यक्ति की आवाज़ और शैली की नकल करता है।
  2. स्वरों का वर्णन किया गया है। ऑडियो एक पाठ में वर्णित दिशानिर्देशों की एक श्रृंखला से उत्पन्न होता है। इसके बारे में सबसे अच्छी बात यह है कि यह नई और अनोखी आवाज़ें बनाना संभव बनाता है।
  3. पुन: डिज़ाइन की गई आवाज़ें. विचार यह है कि पाठ विवरण का उपयोग करके वास्तविक आवाज़ के स्वर और शैली को बदला जाए। हम कह सकते हैं कि यह और भी उच्च स्तर के अनुकूलन के पक्ष में पिछले दो कार्यों का संयोजन है।
  4. ध्वनि प्रभाव. आवाज़ों के अलावा, मेटा द्वारा ऑडियोबॉक्स वर्णनात्मक पाठ से ध्वनि प्रभाव उत्पन्न करने में सक्षम है।
  5. जादू ऑडियो संपादकवॉइस रिकॉर्डिंग से कष्टप्रद पृष्ठभूमि शोर को हटाने के लिए एक उपयोगी उपकरण।
  6. ध्वनि भरना. एक फ़ंक्शन जिसके माध्यम से किसी ऑडियो के भाग को प्रतिस्थापित किया जा सकता है नई ध्वनियाँ.

जैसा कि आप देख रहे हैं, ऑडियोबॉक्स ऑफ़र करता है ऑडियो पेशेवरों और सामग्री निर्माताओं के लिए कई संभावनाएं, हालाँकि यह किसी भी जिज्ञासु उपयोगकर्ता के लिए भी बहुत दिलचस्प है। अभी के लिए, आवाज अभिनेता निश्चिंत हो सकते हैं, क्योंकि परिणामों को देखते हुए, इस एआई द्वारा उत्पन्न आवाजें अभी भी थोड़ी रोबोटिक हैं, स्वाभाविकता से रहित हैं. हालाँकि, इन छोटी असुविधाओं को दूर करने में अभी समय लगेगा।

ऑडियोबॉक्स कैसे आज़माएं

ऑडियोबॉक्स परीक्षण

इस नई तकनीक का परीक्षण करने का सबसे अच्छा तरीका इसे स्वयं आज़माना है। के माध्यम से यह संभव है वेब डेमो ऑडियोबॉक्स, हाल ही में बनाया गया, और अभी भी पूरी तरह से निःशुल्क उपलब्ध है। इसे आज़माने का तरीका यह है: अपनी खुद की आवाज़ रिकॉर्ड करें (या कोई अन्य बजाएँ) और उसके साथ अभ्यास करना शुरू करें। यह उन संभावनाओं में से एक है जो यह तकनीक हमें प्रदान करती है।

हालाँकि यह परीक्षण पृष्ठ फिलहाल स्पेन में उपलब्ध है केवल अंग्रेजी में ही प्रयोग किया जा सकता है, यही वह भाषा है जिसका उपयोग हमें टेक्स्ट का अनुरोध करने और ऑडियो उत्पन्न करने के लिए करना होगा। हमने वाक्यांश के साथ उपलब्ध महिला आवाज़ों में से एक को आज़माया है «यह वेब के लिए एक ध्वनि परीक्षण है Movilforum» और यह परिणाम रहा:

मेटा के ऑडियोबॉक्स का दुरुपयोग और अन्य चिंताजनक मुद्दे

मेटा के ऑडियोबॉक्स की सबसे आश्चर्यजनक विशेषताओं में से एक इस एआई टूल के माध्यम से अपनी आवाज उत्पन्न करने की क्षमता है। लेकिन, साथ ही, यह कई संदेह और अनिश्चितताएं भी पैदा करता है, क्योंकि इसके बारे में संभावित दुरुपयोग के खतरे की योजना बनाता है।

ताकि इस तकनीक का इस्तेमाल रोका जा सके धोखाधड़ी या घोटाले करना, मेटा को इस कार्यक्षमता का परीक्षण करने की अनुमति देने से पहले उपयोग की कई शर्तों की स्वीकृति की आवश्यकता होती है।

इसके अलावा, जेनरेट किए गए ऑडियो में एक प्रकार का "वॉटरमार्क" होता है जिससे उनकी उत्पत्ति का सटीक पता लगाया जा सकता है। प्रेस विज्ञप्ति में जिसका हमने पहले उल्लेख किया था, मेटा बताता है कि यह विशिष्ट वास्तव में एक संकेत है जो मानव कान के लिए अदृश्य है, लेकिन इसका पता लगाया जा सकता है।


अपनी टिप्पणी दर्ज करें

आपका ईमेल पता प्रकाशित नहीं किया जाएगा। आवश्यक फ़ील्ड के साथ चिह्नित कर रहे हैं *

*

*

  1. डेटा के लिए जिम्मेदार: एक्स्ट्रीमिडाड ब्लॉग
  2. डेटा का उद्देश्य: नियंत्रण स्पैम, टिप्पणी प्रबंधन।
  3. वैधता: आपकी सहमति
  4. डेटा का संचार: डेटा को कानूनी बाध्यता को छोड़कर तीसरे पक्ष को संचार नहीं किया जाएगा।
  5. डेटा संग्रहण: ऑकेंटस नेटवर्क्स (EU) द्वारा होस्ट किया गया डेटाबेस
  6. अधिकार: किसी भी समय आप अपनी जानकारी को सीमित, पुनर्प्राप्त और हटा सकते हैं।