
काठमाडौं ।
एनालग घडी पढ्ने वा कुनै मितिमा कुन बार पर्छ भन्ने पत्ता लगाउनेजस्ता मानवहरूका लागि सामान्यजस्तै लाग्ने केही कार्यहरू कृत्रिम बुद्धिमत्ता (एआई) ले सहज रूपमा गर्न नसक्ने नयाँ अनुसन्धानले देखाएको छ।
एआईले कोड लेख्न, मानिसजस्तै आवाजमा पाठ तयार गर्न, यथार्थजस्तै तस्बिर बनाउने वा परीक्षा पास गर्न सक्ने भए पनि, सामान्य एनालग घडीको सुइको स्थिति बुझ्न वा पात्रोसम्बन्धी साधारण गणना गर्नमा बारम्बार चुक्ने गरेको पाइएको छ।
लाइभसाइन्सका अनुसार यो अनपेक्षित कमजोरी २०२५ को इन्टरनेशनल कन्फ्रेन्स अन लर्निङ रिप्रेजेन्टेशन्स (आईसीएलआर) मा सार्वजनिक गरिएको हो। अनुसन्धान मार्च १८ मा प्रिन्टप्रकाशन साइट arXiv मा पनि प्रकाशित गरिएको थियो, यद्यपि यो अध्ययन हालसम्म सहकर्मी समीक्षा अर्थात् पीअर रिभ्यू भइसकेको छैन।
“अधिकांश मानिसहरूले सानो उमेरमै घडी हेर्न र पात्रो प्रयोग गर्न सिक्छन्। हाम्रो अनुसन्धानले देखाउँछ कि एआई ले यस्ता कार्यहरू गर्न अझै ठूलो संघर्ष गरिरहेको छ,” अनुसन्धानका प्रमुख लेखक तथा एडिनबर्ग विश्वविद्यालयका रोहित सक्सेनाले बताएका छन्। “समय महत्त्वपूर्ण हुने कार्यहरू—जस्तै तालिका निर्माण, स्वचालन वा सहायक प्रविधि—मा एआई समावेश गर्न चाहिने हो भने यस्ता कमजोरी सुधार गर्नु आवश्यक छ।”
अनुसन्धानकर्ताहरूले घडी र पात्रोका तस्बिरहरूको विशेष डाटासेट तयार गरेर दृश्य र टेक्स्ट दुवै बुझ्न सक्ने विभिन्न बहुआयामी ठूलो भाषा मोडेलहरू (एमएलएलएम) मा परीक्षण गरेका थिए। प्रयोगमा परेका मोडेलहरूमा मेटाको एललामा ३.२-भिजन, एन्थ्रोपिकको क्लाउड-३.५ सनेट गुगलको जेमिनी २.० र ओपनएआई को जीपीटी-४ओ समावेश छन्।
तर नतिजा कमजोर रह्यो। यी मोडेलहरूले घडीको तस्बिरबाट सही समय वा कुनै मितिमा कुन बार पर्छ भन्ने उत्तर आधाभन्दा कमपटक मात्र ठीक दिएका थिए।
अनुसार सक्सेनाले बताएअनुसार, यस कमजोरीको कारण एआईको सीमित स्थानिक (spatial) सोच क्षमतामा छ। “घडी हेर्नलाई केवल चिन्ने होइन, सुइहरू एक-अर्कामा कसरी ओभरल्याप भएका छन्, कोण नाप्न, रोमन अंक वा अन्य डिजाइनको विविधता बुझ्न आवश्यक हुन्छ,” उनले भने।
पात्रोसम्बन्धी गणना पनि त्यत्तिकै चुनौतीपूर्ण देखियो। उदाहरणका लागि, “वर्षको १५३औं दिन कुन बार पर्छ?” भन्ने प्रश्नमा एआई मोडेलहरूको असफलता दर निकै उच्च थियो। घडी पढ्ने सफलताको दर मात्र ३८.७प्रतिशत र पात्रो गणनाको मात्र २६.३ प्रतिशत थियो।
गणित कम्प्युटिङको आधार भए पनि, एआई मोडेलहरू गणना गर्दैनन्, उनीहरूले प्रशिक्षणमा देखेका ढाँचाका आधारमा उत्तर अनुमान गर्छन्। “एआई ले गणितको नियम प्रयोग गरेर होइन, पहिले देखेका उदाहरणहरूकै आधारमा अनुमान गर्छ,” सक्सेनाले भने।
यो अनुसन्धानले मानव र एआई बीचको बुझाइमा रहेको मूलभूत भिन्नतालाई पुनः उजागर गरेको छ। एआई ले केवल धेरै पटक दोहोरिएका ढाँचाहरूबाट सिक्ने भएकाले अनौठा वा कम देखिने कार्यहरूमा चुक्ने गर्छ। उदाहरणका लागि लिप इयरजस्ता विषेश पात्रो गणनामा एआई असफल हुन सक्छ, यद्यपि उसले त्यससम्बन्धी जानकारी प्रशिक्षणमा पाएको हुन्छ।
अनुसन्धानले एआईको प्रशिक्षणमा अझ लक्षित उदाहरणहरू समावेश गर्नु पर्ने र तर्कासंगत तथा स्थानिक सोचलाई संयोजन गर्ने तरिका पुनः सोच्न आवश्यक रहेको बताएको छ।
“एआई शक्तिशाली छ, तर जब कुनै कार्यमा दृष्टि र सटीक सोच मिसिन्छ, तब गम्भीर परीक्षण, विकल्प योजना र धेरै अवस्थामा मानव हस्तक्षेप अपरिहार्य हुन्छ,” सक्सेनाले भने।
प्रकाशित: ६ जेष्ठ २०८२, मंगलवार