यी हुन् हाल एण्ड्रोइड, म्याकओएस, आईओएस, विण्डोज र लिनक्सका लागि रुचाइएका एआई डिक्टेशन एपहरू

  • Technology Khabar | २० बैशाख २०८३, आईतवार
यी हुन् हाल एण्ड्रोइड, म्याकओएस, आईओएस, विण्डोज र लिनक्सका लागि रुचाइएका एआई डिक्टेशन एपहरू
एआईमार्फत् बनाइएको सांकेतिक तस्बिर

काठमाडौं ।

एआई डिक्टेशन एपहरू छोटो समयमा धेरै सुधारिएका छन्। धेरै वर्षसम्म यी एपहरू ढिलो र कम सटीक थिए। विशेष उच्चारणमा स्पष्ट रूपमा बोल्न नसक्दा यिनीहरुले राम्ररी काम गर्न सक्दैनथे।

आजभोलि ठूला भाषा मोडेल (एलएलएम) र स्पिच-टु-टेक्स्ट मोडेलमा भएको प्रगतिले यसलाई परिवर्तन गरेको छ, जसले बोलिएको कुरा अझ सटीक रूपमा बुझ्न र पर्याप्त सन्दर्भ राख्दै पाठलाई सही रूपमा ढाँचाबद्ध गर्न सक्षम बनाएको छ।

डेभलपरहरूले अनावश्यक शब्दहरू हटाउने, अड्किएका वाक्यहरू सुधार्ने र विरामचिन्ह मिलाउने सुविधा पनि थपेका छन् — जसले गर्दा तयार भएको पाठमा धेरै कम सम्पादन आवश्यक पर्छ। अहिले बजारमा यस्ता दर्जनौं एपहरू उपलब्ध छन्। अहिले उपलब्ध सबैभन्दा राम्रो र उपयोगी डिक्टेशन एपहरू यस्ता छन्:

विस्पर फ्लो

विस्पर फ्लो राम्रो लगानी पाएको एआई डिक्टेशन एप हो जसले तपाईंलाई कस्टम शब्द र निर्देशनहरू थप्न दिन्छ। यसका म्याकओएस, विण्डोज र आईओएसका लागि नेटिभ एपहरू छन् भने एण्ड्रोइड संस्करण तयार हुँदैछ।

यो एपले “फर्मल,” “क्याजुअल,” र “भेरी क्याजुअल” शैली रोजेर तपाईंको पाठ कसरी ट्रान्सक्राइब गर्ने भन्ने कस्टमाइज गर्न दिन्छ, जस्तै व्यक्तिगत सन्देश, काम, र इमेलका लागि। साथै यदि तपाईं कर्सरजस्ता भाइब-कोडिङ टुलहरूसँग प्रयोग गर्नुहुन्छ भने भेरिएबलहरू स्वतः चिन्ने वा च्याटमा फाइल ट्याग गर्ने सुविधा पनि सक्रिय गर्न सकिन्छ।

यो एपले डेस्कटपमा हप्तामा २,००० शब्दसम्म र आईओएसमा महिनामा १ हजार शब्दसम्म निःशुल्क ट्रान्सक्रिप्सन गर्न दिन्छ। पेड सब्स्क्रिप्सन योजनाले असीमित ट्रान्सक्रिप्सन दिन्छ र मूल्य प्रतिमहिना डलरबाट सुरु हुन्छ।

विलो

विलोले आफूलाई टाइप गर्न मन नपर्नेहरूका लागि ठूलो समय बचत गर्ने एप भनेर प्रस्तुत गर्छ। स्वचालित सम्पादन र फर्म्याटिङ जस्ता सामान्य सुविधासँगै, यो एपले केही बोलेका शब्दबाटै पूरा अनुच्छेद तयार गर्न ठूलो भाषा मोडेल प्रयोग गर्छ।

विलोले गोपनीयतालाई प्राथमिकता दिँदै सबै ट्रान्सक्रिप्ट तपाईंको डिभाइसमा नै भण्डारण गर्छ र मोडेल ट्रेनिङबाट बाहिर बस्ने विकल्प पनि दिन्छ। साथै, आफ्नो क्षेत्रको शब्दावली वा स्थानीय बोलिचाल अनुसार मिलाउन कस्टम शब्द थप्न सकिन्छ। डेस्कटप एपमा महिनामा २,००० शब्दसम्म निःशुल्क प्रयोग गर्न पाइन्छ। व्यक्तिगत सब्स्क्रिप्सन योजना प्रतिमहिना १८ डलरबाट सुरु हुन्छ, जसले असीमित डिक्टेशन र लेखन शैली सम्झने सुविधा दिन्छ।

मोनोलग

यदि गोपनीयता तपाईंको प्राथमिकता हो भने, मोनोलगले आफ्नो एआई मोडेल सिधै तपाईंको डिभाइसमा डाउनलोड गरेर प्रयोग गर्न दिन्छ, जसले तपाईंको डेटा क्लाउडमा पठाउनै पर्दैन। साथै, तपाईंले प्रयोग गर्ने एप अनुसार यसको टोन पनि कस्टमाइज गर्न सकिन्छ।

मोनोलगले महिनामा १,००० शब्दसम्म निःशुल्क ट्रान्सक्रिप्सन दिन्छ; सब्स्क्रिप्सन प्रतिमहिना डलर वा वार्षिक १०० डलर पर्छ। कम्पनीले धेरै सक्रिय प्रयोगकर्तालाई मनोकी नामको फिजिकल सर्टकट डिभाइस पनि दिन्छ।

सुपरव्हिस्पर

सुपरव्हिस्पर मुख्य रूपमा डिक्टेशन एप हो, तर यसले अडियो वा भिडियो फाइलबाट पनि ट्रान्सक्रिप्सन गर्न सक्छ। यसमा विभिन्न गति र सटीकताका आफ्नै एआई मोडेलहरू र एनभिडियाको पाराकीट स्पिच-रिकग्निसन मोडेल डाउनलोड गरेर प्रयोग गर्न सकिन्छ।

यसले आउटपुटलाई नियन्त्रण गर्न कस्टम प्रम्प्ट लेख्न दिन्छ, र प्रोसेस गरिएको तथा नगरेको दुवै ट्रान्सक्रिप्ट सिधै किबोर्डबाट हेर्न सकिन्छ। आधारभूत भ्वाइस-टु-टेक्स्ट सुविधा निःशुल्क छ र प्रो सुविधाहरू (जस्तै अनुवाद र ट्रान्सक्रिप्सन) परीक्षण गर्न १५ मिनेट दिइन्छ। पेड संस्करणले आफ्नै एआई एपीआई कीAPI key प्रयोग गर्न र क्लाउड तथा लोकल मोडेल जोड्न दिन्छ, कुनै प्रयोग सीमा बिना।

यसको मासिक योजना ८४.९, वार्षिक योजना ८४.९९ डलर वा लाइफटाइम सब्स्क्रिप्सन २२४.९९ डलरमा उपलब्ध छ।

भोइसटाइपर

भोइसटाइपरले अफलाइन-प्राथमिक र बिना सब्स्क्रिप्सनको मोडेल अपनाएको छ, जसले लोकल मोडेल प्रयोग गरेर ट्रान्सक्रिप्सन गर्न दिन्छ। यसमा गिटहब रिपोजिटरी पनि छ, जसले चाहनेलाई आफ्नै रूपमा होस्ट र चलाउन मद्दत गर्छ। भोइसटाइपरले ९९ भन्दा बढी भाषालाई समर्थन गर्छ र म्याक तथा विण्डोज दुवैमा काम गर्छ।

यो एप तीन दिन निःशुल्क प्रयोग गर्न सकिन्छ, त्यसपछि लाइफटाइम लाइसेन्स किन्न सकिन्छ। एक डिभाइसका लागि ३५ डलर, दुईका लागि $56, र चारका लागि ९८ डलर पर्छ।

आक्वा

आक्वा वाईकम्बिनेटर समर्थित भ्वाइस-टाइपिङ एप हो, जुन विण्डोज र म्याकओएसमा उपलब्ध छ र कम विलम्ब (लेटेन्सी) का हिसाबले यसले आफूद्लाई श्रेणीकै सबैभन्दा छिटो टुलमध्ये एक भएको दावी गर्छ। व्याकरण र विरामचिन्ह मिलाउनुका साथै आक्वाले वाक्य बोल्दै टेक्स्ट स्वतः भर्न पनि दिन्छ — उदाहरणका लागि “माइ एड्रेस” भनेपछि तपाईंको ठेगाना आफैं टाइप हुन्छ।

यसले आफ्नै स्पिच-टु-टेक्स्ट एपीआई पनि प्रदान गर्छ, जसले अन्य एपहरूलाई यसको ट्रान्सक्रिप्सन इन्जिन प्रयोग गर्न दिन्छ। निःशुल्क संस्करणले महिनामा १ हजार शब्द दिन्छ। पेड योजना प्रतिमहिना डलर (वार्षिक बिलिङ) बाट सुरु हुन्छ, जसले असीमित शब्द र ८०० कस्टम शब्दको सुविधा दिन्छ।

ह्याण्डी

ह्याण्डी ओपन-सोर्स, निःशुल्क ट्रान्सक्रिप्सन टुल हो, जुन म्याक, विण्डोज र लिनक्समा चल्छ। यो एप सामान्य छ र धेरै कस्टमाइजेसन सुविधा छैन, तर बिना खर्च आवाज प्रयोग गर्न चाहनेका लागि राम्रो विकल्प हो। यसमा साधारण सेटिङ मेनु छ जसले पुश-टू-टक अन/अफ गर्न र ट्रान्सक्रिप्सन सुरु गर्ने हटकी परिवर्तन गर्न दिन्छ।

टाइपलेस

टाइपलेस आफ्नो उच्च निःशुल्क शब्द सीमाका कारण फरक देखिन्छ। कम्पनीले कुनै डाटा राख्दैन वा एआई ट्रेनिङका लागि प्रयोग गर्दैन भन्ने दाबी गर्छ। यसले तपाईंले गल्ती गरेको वाक्यलाई पुनःलेखन पनि गर्न सक्छ।

यसले निःशुल्क संस्करणमा हप्तामा ४,००० शब्द (महिनामा करिब १६,००० शब्द) डिक्टेशन गर्न दिन्छ। प्रतिमहिना १२ डलर (वार्षिक बिलिङ) तिरेर असीमित शब्द र नयाँ सुविधा पाउन सकिन्छ। टाइपलेस विण्डोज र म्याकओएसमा मात्र उपलब्ध छ।

भोइसइंक

भोइसइंक म्याकका लागि ओपन-सोर्स निजी डिक्टेशन एप हो। यसले रेकर्ड सुरु/बन्द गर्न ग्लोबल शर्टकट र पुश-टू-टक मोड समर्थन गर्छ। स्क्रिनमा देखिएको सन्दर्भ पढेर यसले आफ्नो आउटपुट मिलाउँछ। यसले केही एप र यूआरएल स्वतः चिनेर प्रत्येकका लागि फरक फर्म्याट वा नियम लागू गर्न सक्छ। साथै यसमा प्रश्नको उत्तर दिने असिस्टेन्ट मोड पनि छ। एक डिभाइसका लागि लाइफटाइम मूल्य २५ डलर, दुईका लागि ३९ डलर र तीनका लागि ४९ डलर पर्छ।

डिक्ट्याटो

डिक्ट्याटो म्याकका लागि ९.९९ यूरो (करिब १२ पाउण्ड) मूल्यको डिक्शनरी एप हो, जसले लाइफटाइम पहुँच र दुई वर्षसम्म अपडेट दिन्छ। यसले पाराकीट, व्हिस्पर र एप्पल स्पीच एनालाइजर जस्ता अफलाइन मोडेल प्रयोग गर्छ र एप्पल इन्टेलिजेन्स प्रयोग गरेर हल्का पढाइ र अनावश्यक शब्द हटाउने काम गर्छ। यी लोकल मोडेलका कारण एपले ८० मिलिसेकेण्ड जति कम ढिलाइ हुने दावी गर्छ, जसले गर्दा तपाईं बोल्नासाथ टेक्स्ट झण्डै तुरुन्त देखिन्छ।

अडियोपेन

अडियोपेन सुरुमा वेब-आधारित भ्वाइस नोट एप थियो, तर समयसँगै विकसित भएको छ। यसको म्याक संस्करणले तपाईंलाई टेक्स्ट डिक्टेशन गर्न र आफूले चाहेको शैली र ढाँचामा पुनःलेखन गर्न दिन्छ, जहाँ तपाईं जुनसुकै बेला शैली परिवर्तन गर्न सक्नुहुन्छ।

लाइभ ट्रान्सक्रिप्सनबाहेक अडियोपेनले विभिन्न प्लेटफर्ममा अडियो नोट सुरक्षित राख्न, नोटहरू जोडेर सारांश बनाउन, अडियो फाइल अपलोड गर्न, र पुराना नोटहरूलाई एआई प्रयोग गरेर पुनःलेखन गर्न दिन्छ। यसको मूल्य तीन महिनाका लागि ३३ डलर, एक वर्षका लागि ९९ डलर र दुई वर्षका लागि १५९ डलर छ। –टेकक्रञ्च

प्रकाशित: २० बैशाख २०८३, आईतवार

तपाइको प्रतिक्रिया
Loading comments...

ताजा समाचार