गुगलले आफ्नो भर्टेक्स एआई प्लेटफर्ममा थप्यो एचडी भ्वाइस मोडल चर्प ३

  • Technology Khabar | ५ चैत्र २०८१, मंगलवार

काठमाडौं ।

जेनेरेटिभ एआईमा अहिलेसम्म धेरै ध्यान टेक्स्टमा आधारित इन्टरफेसहरूमा केन्द्रित रहेको छ जसले टेक्स्ट, फोटोहरू र अन्य सामग्रीहरू बनाउन प्रयोग गरिन्छ। अबको अर्को लहर स्वर (भ्वाइस) मा देखिन्छ, र यो छिट्टै आइरहेको छ।

पछिल्लो विकासमा, गुगलले हालै आउँदो हप्तादेखि यसको भर्टेक्स एआईविकास प्लेटफर्ममा आफ्नो एचडी भ्वाइस इन्टरफेस चर्प ३ थपिने घोषणा गरेको छ।

गएको हप्ता गुगलले शान्त रूपमा चर्प ३ ले ३१ भाषाहरूका लागि ८ नयाँ स्वरहरू ल्याउने घोषणा गरेको थियो। यो प्लेटफर्मका प्रयोगहरूमा भ्वाइस असिस्टेन्टहरू निर्माण गर्ने, अडियोबुकहरू बनाउने, सपोर्ट एजेन्टहरू विकास गर्ने र भिडियोहरूको लागि भ्वाइस-ओभर सिर्जना गर्ने समावेश छन्। यो समाचार लन्डनमा रहेको गुगलको डीपमाइण्ड कार्यालयमा आयोजित एक कार्यक्रममा घोषणा गरिएको रोयटर्सले उल्लेख गरेको छ।

गुगलको प्रयास अरू डेभलपरहरुले पनि आफ्नो भ्वाइस एआई काममा ठूलो फड्को मार्दै गरेका बेला आइरहेको छ।

गएको हप्ता, भाइरल र अत्यन्त वास्तविक सुनिने “माया” र “माइल्स” एआई एपहरू पछाडि रहेको स्टार्टअप सेसेमीले आफ्नै प्रविधिमा आधारित गरी डेभलपरहरूले आफ्ना कस्टमाइज्ड एप्स र सेवाहरू निर्माण गर्न सक्ने नयाँ मोडल सार्वजनिक गरेको घोषणा गरेको थियो।

विशेष रूपमा, दुरुपयोग रोक्नका लागि चर्प ३ मा प्रयोग प्रतिबन्धहरू हुनेछन्। “हामी अहिले यी कुराहरूमा हाम्रो सुरक्षा टोलीसँग काम गरिरहेका छौं,” गुगल क्लाउडका सीईओ टमस कुरियनले पत्रकार सम्मेलनमा बताए।

एभरल्याब्स ती प्रमुख स्टार्टअपहरू मध्ये एक हो, जसले एआई भ्वाइस सेवाहरूमा आफ्नो काम विस्तार गर्न सयौं करोड डलरको लगानी जुटाइसकेको छ। यो समाचारले चर्प ३ लाई गुगलको प्रमुख एलएलएम जेमिनीका नयाँ संस्करणहरू, साथै यसको फोटो बनाउने मोडल इमेजन र महँगो भियो २ भिडियो निर्माण उपकरणसँगै ल्याउनेछ।

गुगलले चर्प ३ मार्फत ल्याउने आवाजहरू अन्य एआई प्रयासहरूले बनाएका “मानवीय” आवाजहरू जस्तै “वास्तविक” हुनेछन् कि हुँदैनन् भन्ने बहस योग्य छ (सेसमीको काम विशेष रूपमा उल्लेखनीय छ)। तर डीपमाइण्डका सीईओ डेमिस हसाबिसले जोड दिएझैं, यो म्याराथन हो, दौड होइन’, रोयटर्सले लेखेको छ।

प्रकाशित: ५ चैत्र २०८१, मंगलवार

तपाइको प्रतिक्रिया
Loading comments...