
काठमाडौं ।
शाओमीले एडभान्स साउण्ड रिकग्नीसन टेकको साथ विश्वव्यापी प्रतिस्पर्धीहरूलाई उछिनेको छ।
शाओमीले अडियो ट्यागिङ कार्यहरूको क्षेत्रमा महत्त्वपूर्ण प्रगति गर्दै आफ्नो सेल्फ-डेभलप्ड साउण्ड रिकग्नीसन एल्गोरिथ्मको साथ एक उल्लेखनीय कोसेढुङ्गा हासिल गरेको बताइएको हो।
प्रशिक्षणको लागि सार्वजनिक रूपमा उपलब्ध डाटासेट अडियो सेट-२ एम बाट अडियो डाटा प्रयोग गरेर, शाओमीको अडियो ट्यागिङ मोडलले पहिलो पटक ५० एमएपी भन्दा बढी स्कोर हासिल गरेको छ। यस उपलब्धिले शाओमीको साउण्ड रिकग्नीसन एल्गोरिदमलाई विश्वव्यापी मञ्चमा एक नेतृत्वको रूपमा स्थान दिएको बताइएको छ।
गुगलले अडियोसेट डाटासेटलाई तीन भागहरूमा विभाजन गरेको थियो। पहिलो दुई उपसमूहहरूलाई सामूहिक रूपमा प्रशिक्षण उद्देश्यका लागि प्रयोग गरिएको ” अडियो सेट-२ एम ” भनिन्छ। यो प्रशिक्षण डाटासेट भित्र थियाे जुन शाओमीको साउण्ड रिकग्नीसन एल्गोरिदम मोडलले अडियो ट्यागिङ टेक्नोलोजीमा नयाँ मानक सेट गर्दै ५० एमएपी थ्रेसहोल्ड पार गरेको उल्लेख छ।
यसबाहेक, शाओमीले रिसोर्स-कन्स्ट्रेन्ड परिदृश्यहरूका लागि अनुकूल यस मोडेलको एक मिनी संस्करण पनि प्रस्तुत गरेको छ। यसको कम आकारको बावजुद, यो मिनी मोडलले अन्य संस्थाहरू समान मोडलहरू भन्दा राम्रो प्रदर्शन गर्ने दाबी छ।
यो प्राविधिक प्रगतिलाई समग्र प्रयोगकर्ता अनुभव बढाउँदै शाओमीका स्मार्ट डिभाइसहरूमा व्यापकरूपमा लागू गर्न सकिने उल्लेख छ। एल्गोरिदमले बच्चाको रुवाइ, जनावरको आवाज, कार इन्जिनहरू, तथा थप अन्य विभिन्न वातावरणीय ध्वनिहरू पहिचान गर्नमा उत्कृष्ट हुनेछ।
यसबाहेक, शाओमीका रोबोटहरूले यस एल्गोरिदम प्रविधिबाट अन्य धेरै फाइदा लिने उल्लेख छ। साइबरओन नामको ह्युमनोइड रोबोटले ८५ प्रकारका वातावरणीय आवाजहरू पहिचान गर्न सक्छ भने श्रवण संवेदनका माध्यमबाट मानवीय भावनाहरूको विस्तृत श्रृंखला बुझ्न सक्दछ।
दोस्रो पुस्ताको बायोमिमेटिक क्वाड्रप्ड रोबोट साइबरडग २ ले ३८ प्रकारका वातावरणीय आवाजहरू पहिचान गर्न सक्छ। यसले यसको डायनामीक रेस्पोन्स क्यापाब्लिटीजहरु लाई अझ बढाउने रिपोर्टमा उल्लेख छ।
प्रकाशित: २९ भाद्र २०८०, शुक्रबार