इलन मस्कको ‘ग्रोक-३’ एआई चीनको ‘डिपसिक’ भन्दा राम्रो: रिपोर्ट

Technology Khabar | २५ चैत्र २०८१, सोमबार

काठमाडौं ।

आर्टिफिसियल इन्टेलिजेन्स (एआई) को बढ्दो प्रवृत्तिको बीचमा, इलन मस्कको स्वामित्वमा रहेको ‘ग्रोक’ र चीनको ‘डीपसिक’ मोडेल अब एआई क्षमताहरूको सन्दर्भमा अग्रपंक्तिमा छन्।

शनिबार जारी गरिएको एक रिपोर्ट अनुसार, एउटा मोडेल पहुँच र दक्षताको हिसाबले राम्रो छ भने अर्को स्केलको हिसाबले राम्रो छ। यद्यपि, दुवै मोडेलका लागि तालिम स्रोतहरू उल्लेखनीय रूपमा फरक छन्।

काउन्टरपोइन्ट रिसर्चका अनुसार, ग्रोक-३ ले स्केलमा सम्झौता गर्दैन। यसमा २ लाख एनभिडिया एच१०० (Nvidia H100-टेन्सर कोर जीपीयू) को लागि समर्थन छ। साथै, डीपसिक आर-१ (DeepSeek-R1) ले धेरै सानो भाग प्रयोग गरेर पनि यसलाई चुनौती दिइरहेको छ, जसले नवीन वास्तुकला र क्युरेसनले ठूला पूर्वाधारसँग प्रतिस्पर्धा गर्न सक्छ भन्ने देखाउँछ।

डिपसिकले फेब्रुअरीमा आफ्नो प्रमुख तर्क मोडेल, डिपसिक-आर१ लाई खुला स्रोत बनाएर विश्वव्यापी रूपमा चर्चा पाएको थियो। यो मोडेलले विश्वको फ्रन्टियर तर्क मोडेलहरूसँग तुलना गर्न सकिने कार्यसम्पादन प्रदान गर्दछ।

“यसको विशिष्टता यसको अद्भुत क्षमताहरूमा मात्र नभई एच१०० को सानो, निर्यात-अनुकूलित विकल्प, केवल दुई हजार एनभीडिया एच८०० जीपीयू (NVIDIA H800 GPU) हरू प्रयोग गरेर प्रशिक्षित गरिएको तथ्यमा पनि निहित छ, जसले यसको उपलब्धिलाई दक्षतामा एक मास्टरक्लास बनाउँछ,” काउन्टरपोइन्टका प्रमुख एआई विश्लेषक वेई सनले भने।

मस्कको एक्सएआईले ग्रोक-३ प्रस्तुत गर्यो, जुन यसको अहिलेसम्मको सबैभन्दा उन्नत मोडेल हो। यो मोडेलले डीपसिक आर १, ओपनएआईको जीपीटी-ओ१ (GPT-O1), र गुगलको जेमिनी २ (Gemini 2) भन्दा राम्रो परफरमेन्स प्रदान गर्दछ।

“डीपसिक आर १ भन्दा फरक, ग्रोक ३ (Grok-3) लाई एक्सएआईको सुपर कम्प्युटर कोलोससमा २ लाख एच१०० जीपीयूहरू प्रयोग गरेर प्रशिक्षित गरिएको छ,” सनले भने।

ग्रोक-३ ले ठूलो स्तरको रणनीतिलाई मूर्त रूप दिन्छ, जसमा विशाल कम्प्युट स्केल (GPU लागतमा अरबौं डलर प्रतिनिधित्व गर्दछ) ले निरन्तर बढ्दो कार्यसम्पादन लाभलाई प्रोत्साहित गर्दछ।

यो त्यस्तो मार्ग हो जुन केवल धनी प्राविधिक दिग्गजहरू वा सरकारहरूले मात्र वास्तविक रूपमा पछ्याउन सक्छन्।

“यसको विपरित, डीपसिक आर १ ले, मिक्सचर-अफ-एक्सपर्ट्स (एमओई) र तर्कको लागि सुदृढीकरण सिकाइ (रीजनिङ्गका लागि रीइन्फोर्समेन्ट लर्निङ्ग) जस्ता प्रविधिहरूको लाभ उठाएर, क्युरेट गरिएको र उच्च-गुणस्तरको डाटासँग मिलाएर, कम्प्युटको एक अंशसँग तुलनात्मक परिणामहरू प्राप्त गर्न एल्गोरिदमिक सरलताको शक्ति प्रदर्शन गर्दछ,” सनले व्याख्या गरे।

ग्रोक-३ ले १०० गुणा बढी जीपीयूहरू तैनाथ गर्नाले छिट्टै सीमान्त कार्यसम्पादन लाभ प्राप्त गर्न सकिन्छ भन्ने प्रमाणित गर्छ। तर यसले लगानीमा प्रतिफल (आरओआई) द्रुत गतिमा घट्दै गएको कुरालाई पनि प्रकाश पार्छ।

प्रतिवेदनले भन्छ कि डिपसिक आर १ ले न्यूनतम हार्डवेयर ओभरहेडको साथ उत्कृष्ट कार्यसम्पादन प्राप्त गर्ने बारे हो, जबकि ग्रोक ३ ले आवश्यक पर्ने कुनै पनि कम्प्युटेसनल माध्यमबाट सीमालाई तोडेर बाहिर अगाडि बढ्ने बारे हो।

प्रकाशित: २५ चैत्र २०८१, सोमबार