ओपनएआईले आफ्नो भ्वाइस क्लोनिङ टूललाई जनरल रिलीजका लागि जोखिमपूर्ण ठान्यो

Technology Khabar २० चैत्र २०८०, मंगलवार

काठमाडौं ।

ओपनएआईको एउटा नयाँ टूल जसले रेकर्ड गरिएको अडियो केबल १५ सेकेन्ड प्रयोग गरेर कसैको आवाजको विश्वसनिय क्लोन तयार गर्न सक्छ। जसलाई सामान्य (जेनरल) रिलीजको लागि धेरै जोखिमपूर्ण मानिएको छ। एआई ल्याब विश्वव्यापी चुनावको वर्षमा गलत सूचना मार्फत हुने खतरालाई कम गर्न चाहन्छ।

भ्वाइस इन्जिन पहिलो पटक २०२२ मा विकसित गरिएको थियो र च्याटजीपीटीमा निर्मित टेक्स्ट-टु-स्पीच फिचरको लागि प्रारम्भिक भर्सनमा प्रयोग गरिएको थियो। तर यसको शक्ति कहिले पनि सार्वजनिक रूपमा प्रकट गरिएको छैन। आंशिक रूपमा ‘सतर्क र सूचित’ दृष्टिकोणको कारण जुन ओपनएआईले यसलाई अझ व्यापक रूपमा जारी गर्न लिइरहेको छ।

‘हामी सिंथेटिक आवाजहरूको जिम्मेवार परिनियोजन र समाजले यी नयाँ क्षमताहरूलाई कसरी अनुकूलन गर्न सक्छ भन्ने बारेमा संवाद सुरु गर्ने आशा गर्छौं,’ ओपनएआईले हस्ताक्षर नगरिएको ब्लगपोस्टमा भनेको दगार्जियनले उल्लेख गरेको छ, ‘ यी वार्तालापहरू र यी साना-स्तरीय परीक्षणहरूको नतिजाको आधारमा, हामी यो प्रविधिलाई स्केलमा कसरी प्रयोग गर्ने भन्ने बारे थप जानकारीपूर्ण निर्णय गर्नेछौं।’

आफ्नो पोस्टमा कम्पनीले विभिन्न साझेदारहरूबाट टेक्नोलोजीको वास्तविक–विश्व प्रयोगहरूको उदाहरण साझा गरेको छ जसलाई तिनीहरूको आफ्नै एप्स र उत्पादनहरूमा निर्माण गर्न पहुँच दिइएको थियो।

एज्युकेशन टेक्नोलोजी फर्म एज अफ लर्निङले यसलाई स्क्रिप्टेड भ्वाइसओभरहरू जेनेरेट गर्न प्रयोग गर्छ। जबकि ‘एआई भिजुअल स्टोरीटेलिङ’ एप हेजेनले प्रयोगकर्ताहरूलाई रेकर्ड गरिएका सामग्रीको अनुवादलाई प्रवाहित तर मौलिक स्पिकरको उच्चारण र आवाजलाई सुरक्षित गर्ने तरिकाले सिर्जना गर्ने क्षमता प्रदान गर्दछ। उदाहरणका लागि, फ्रान्सेली स्पिकरबाट अडियो नमूनाको साथ अंग्रेजी उत्पन्न गर्दा फ्रान्सेली उच्चारणको साथ भाषण उत्पादन हुन्छ।

प्रकाशित: २० चैत्र २०८०, मंगलवार

तपाइको प्रतिक्रिया