काठमाडौं ।
माइक्रोसफ्टले आफ्नो भर्खरको कम्प्याक्ट “सानो भाषा मोडेल”, फाइ-२ (Phi-2) जारी गरेको छ, जसले १३ बिलियन भन्दा कम प्यारामिटरहरू भएका केही ठूला ओपन सोर्स लामा २ मोडेलहरू भन्दा राम्रो वा राम्रो प्रदर्शन गर्दछ।
विगत केही महिनाहरूमा, माइक्रोसफ्ट रिसर्चको मेसिन लर्निङ फाउन्डेशन टोलीले “फाइ” नामक ‘स्मल ल्याङ्गवेज मोडेल (एसएलएम)’ को एक सूइट जारी गरेको छ जसले विभिन्न बेन्चमार्कहरूमा उल्लेखनीय प्रदर्शन देखाउँदछ।
पहिले, १.३ बिलियन प्यारामिटरहरू भएको फाइ १ मोडेलले अवस्थित एसएलएम हरू (विशेष गरी ह्युमनइभील HumanEval र एमबीपीपी MBPP बेन्चमार्कहरूमा) पाइथन कोडिङमा अत्याधुनिक दक्षता देखाएको छ।
कम्पनीले भन्यो “हामी अब २.७ बिलियन प्यारामिटरहरू भएको भाषा मोडेल फाइ २ जारी गर्दैछौं, जसले उत्कृष्ट तर्क र भाषा बुझ्ने क्षमताहरू प्रदर्शन गर्दछ। यस अपडेटले १३ अर्ब भन्दा कम प्यारामिटरहरू भएका आधार भाषा मोडेलहरू बीचको अत्याधुनिक प्रदर्शन प्रदान गर्दछ।”
“हामीले भाषा मोडेलहरूमा अनुसन्धान र विकासलाई प्रोत्साहित गर्न एजुर एआई स्टुडियो मोडेल क्याटलगमा फाइ-२ उपलब्ध गराएको छ,” माइक्रोसफ्टले भन्यो।
भाषा मोडेलहरूको आकारमा सयौं अरबौं प्यारामिटरहरूमा ठूलो वृद्धिले धेरै उदीयमान क्षमताहरूलाई अनलक गरेको छ जसले प्राकृतिक भाषा प्रशोधनको परिदृश्यलाई पुन: परिभाषित गरेको छ।
माइक्रोसफ्टले भन्यो, “फाइ मोडेलसँगको हाम्रो कामले यस प्रश्नको जवाफ दिने उद्देश्य एसएलएमलाई तालिम दिने हो जसले धेरै उच्च स्तरका मोडेलहरूसँग तुलनात्मक प्रदर्शन हासिल गर्दछ।”
कम्पनीले अनुसन्धान समुदायबाट सामान्यतया प्रयोग हुने संकेतहरूमा व्यापक परीक्षण पनि गरेको छ।
“हामीले बेन्चमार्क परिणामहरूसँग निरन्तर व्यवहार देख्यौं,” टेक विशालले भने।
प्रकाशित: ३ पुष २०८०, मंगलवार