आईओएसका सबै प्लेटफर्ममा बोलेकै भरमा टाइप गरिदिने भ्वाइस कीबोर्ड: विण्डोज र एण्ड्रोइडमा छिट्टै आउँदै

Technology Khabar २८ कार्तिक २०८२, शुक्रबार

काठमाडौं ।

आधुनिक एआई मोडेलको सबैभन्दा प्रभावकारी प्रयोगमध्ये एउटा हो—मानव आवाज बुझ्ने क्षमतामा आएको सुधार, जसले बोलेर टाइप गर्ने उपकरणहरू अझ सटीक बनाएका छन्। यस्तै उपकरणमध्ये म्याकका लागि उपलब्ध ‘विलो’ अब आइओएसका लागि पनि सार्वजनिक हुँदैछ, जसले प्रयोगकर्तालाई सबै एपमा बोलेर टाइप गर्न दिनेछ।

‘विस्पर फ्लो’ जस्तै विलोको कीबोर्डले प्रयोगकर्ताको आवाजलाई केवल लेखमै रूपान्तरण गर्दैन, सन्दर्भअनुसार स्वचालित रूपमा वाक्य पनि फर्म्याट गर्छ। यो एपले १०० भन्दा बढी भाषालाई समर्थन गर्छ र प्रयोगकर्ताले आफ्नै शब्दावली निर्धारण गर्न वा काम, सन्देश, इमेलजस्ता फरक श्रेणीका एपका लागि फरक लेखन शैली बनाउन सक्छन्।

विलोको मुख्य विशेषता भनेको यसमा पूरै कीबोर्ड उपलब्ध हुनु हो जबकि विस्पर फ्लोमा केवल नम्बर टाइप गर्न सकिने कीबोर्ड छ। यसले साना सम्पादन गर्न सजिलो बनाउँछ, जसका लागि फेरि टाइप गर्नुपर्दैन। साथै, बोल्नु सट्टा केही शब्द लेख्न चाहिँ फेरि अर्को कीबोर्डमा स्विच गर्न पनि पर्दैन।

टेकक्रञ्चका अनुसार विलोका संस्थापक एलन गुओ र लरेन्स लिउ दुवै स्ट्यानफोर्ड विश्वविद्यालयका विद्यार्थी थिए जसले पछि पढाइ छोडेर स्टार्टअप सुरु गरे। उनीहरू सन् २०२४ को गर्मीमा वाई कम्बिनेटरमा प्रवेश गरेका थिए, तर सुरुमा उनीहरूको योजना वृद्धाश्रम व्यवस्थापनका लागि स्वास्थ्य क्षेत्रसँग सम्बन्धित सफ्टवेयर बनाउने थियो। तर त्यो तरिका लामो समय टिकेन र कम्पनीले करिब एक वर्षसम्म विभिन्न नयाँ प्रयासहरू गर्‍यो।

गुओका अनुसार, “हामी स्वास्थ्य क्षेत्रमा काम गरिरहँदा चिकित्सकहरूले रोगीसँगको संवाद रेकर्ड गर्ने तथा त्यसको नोट तयार गर्ने आवाज-आधारित एआई स्क्राइब प्रयोग गर्ने गरेको देख्यौं। उनीहरूले यो धेरै उपयोगी भएको बताए। यहीँबाट हामीले सबै खालका ज्ञानकर्मी र अन्य प्रयोगकर्ताका लागि आवाज-आधारित उपकरण बनाउने सोच्यौं,” उनले भने।

गुओका अनुसार उनले अर्को एआई नोटटेकर बनाउन नचाहनुको कारण यो बजार पहिले नै भरिएको महसुस गरेका थिए। उनको भनाइमा बोलेर टाइप गर्ने क्षेत्रमा अझ ठूलो सम्भावना छ किनकि अधिकांश संवाद बैठकभन्दा बाहिर हुने गर्छ। विलोले विभिन्न मोडेलहरूको प्रयोग गर्छ र मेटाको एललामा मोडेलमा आधारित टेक्स्ट–टु–टेक्स्ट पाइपलाइनलाई फर्म्याटिङ र व्यक्तिगत बनावटका लागि लगातार सुधार गरिरहेको छ।

स्टार्टअपले आफ्नो वाई कम्बिनेटर ब्याचलाई सन् २०२५ को वसन्त ऋतुमा सारेर उत्पादन सार्वजनिक गर्‍यो। त्यसयता प्रयोगकर्ता संख्या महिनैपिच्छे ५० प्रतिशतले बढिरहेको कम्पनीले जनाएको छ। विलोका प्रयोगकर्ता कम्पनीहरूमा उबर, हेइडी हेल्थ र जेगोजस्ता ठूला नामहरू पनि समावेश छन् जसले टोलीगत शब्दावलीजस्ता विशेषतासहित बोलेर टाइप गर्ने कामका लागि विलो प्रयोग गर्छन्।

विलोले हालसम्म बक्स ग्रुप, वाई कम्बिनेटर, बर्स्ट क्यापिटल र हबस्पटका धर्मेश शाह, गस्टोका टोमर लन्डन, रेडिटका सह–संस्थापक एलेक्सिस ओहानियन, येल्पका पूर्व सीओओ किप बोडनर, ओपनडोरका सीईओ काज नेजाटियन, अनरका सह–संस्थापक एडम गिल्ड र इन्स्टाकार्टका सह–संस्थापक म्याक्स मुल्लनजस्ता एन्जल लगानीकर्ताहरूबाट ४.५ मिलियन डलर उठाएको छ।

मुल्लनका अनुसार, भविष्यका सबैभन्दा प्रभावशाली प्रयोगकर्ता इन्टरफेसहरू आवाज–आधारित हुनेछन्। उनले भने, “म एलनको दृष्टिबाट निकै प्रभावित भएँ। विलो केवल बोलेर टाइप गर्ने एप होइन, दीर्घकालमा यो तपाईंको कम्प्युटर नियन्त्रण गर्न सक्ने इन्टरफेस बन्नेछ। विलो प्रयोग गर्दा मलाई कम सम्पादन गर्नुपर्छ, जुन कम्प्युटरको बिल्ट–इन डिक्टेशन प्रणालीमा सम्भव थिएन।”

उनले डेस्कटपमा ‘हे विलो’ आदेश दिएर आफ्नै आवाजमा इमेलको उत्तर लेखाउन सकिने सुविधा आफूलाई मनपर्ने कार्यप्रवाहमध्ये एक भएको बताए।

विलो अहिले विस्पर फ्लो (जसले हालसम्म ५६ मिलियन डलरभन्दा बढी उठाइसकेको छ), इभ्रीको ‘मोनोलग’, र वाई कम्बिनेटरबाटै आएका आक्वा, टकटास्टिक, सुपरविस्पर र बेटरडिक्शनजस्ता प्रतिस्पर्धीहरूसँग प्रतिस्पर्धा गर्दैछ।

गुओका अनुसार विलोले आगामी महिनाहरूमा विण्डोज र एण्ड्रोइड प्लेटफर्ममा विस्तार गर्ने र व्यक्तिगत फर्म्याटिङ सुधारमार्फत प्रयोगकर्ताले डिक्टेशनपछि गर्नुपर्ने म्यानुअल सम्पादन घटाउने योजना बनाएको छ।

प्रकाशित: २८ कार्तिक २०८२, शुक्रबार

तपाइको प्रतिक्रिया