एन्थ्रोपिक एआई मोडेलको मूल्याङ्कनका लागि नयाँ एआई बेन्चमार्क विकास गर्न फण्ड दिने

Technology Khabar | १९ असार २०८१, बुधबार

फाइल तस्बिर

काठमाडौं ।

एन्थ्रोपिकले मंगलबार उन्नत कृत्रिम बुद्धिमत्ता (एआई) मोडेलहरूको क्षमताहरू परीक्षण गर्न नयाँ बेन्चमार्कहरू विकास गर्ने नयाँ पहल घोषणा गरेको छ। एआई फर्मले परियोजनाको लागि आर्थिक सहयोग गर्नेछ र इच्छुक संस्थाहरूबाट आवेदनहरू आह्वान गरेको छ।

कम्पनीले विद्यमान बेन्चमार्कहरुको क्षमताहरू र नयाँ ठूलो भाषा मोडेल (एलएलएम) को प्रभाव पूर्णरूपमा परीक्षण गर्न पर्याप्त नभएको बताएको छ। “नतिजा स्वरूपमा, एआई सुरक्षा, उन्नत क्षमताहरू, र यसको सामाजिक प्रभावमा केन्द्रित मूल्याङ्कनहरूको नयाँ सेट विकास गर्न आवश्यक छ,” एन्थ्रोपिकले भनेको छ।

एउटा न्यूजरूम पोस्टमा, एआई मोडेलहरूको लागि नयाँ बेन्चमार्कहरू फण्डिङ्ग गर्नका लागि एन्थ्रोपिकले हालको बेन्चमार्कहरूको सीमित दायरालाई पार गर्न व्यापक तेस्रो-पक्ष मूल्याङ्कन इकोसिस्टमको आवश्यकतालाई हाइलाइट गर्यो। एआई फर्मले आफ्नो पहल मार्फत गुणस्तर र उच्च सुरक्षा मापदण्डहरूमा केन्द्रित एआई मोडेलहरूको लागि नयाँ मूल्याङ्कनहरू विकास गर्न चाहने तेस्रो-पक्षीय संगठनहरूलाई कोष दिने घोषणा गर्यो।

एन्थ्रोपिकका लागि, उच्च-प्राथमिकता क्षेत्रहरूमा कार्यहरू र प्रश्नहरू समावेश छन्, जसले एलएलएमको एआई सुरक्षा स्तरहरू (एएसएल), विचारहरू र प्रतिक्रियाहरू उत्पन्न गर्ने उन्नत क्षमताहरूका साथै यी क्षमताहरूको सामाजिक प्रभावहरू मापन गर्न सक्छन्।

एएसएल क्याटगोरी अन्तर्गत, कम्पनीले धेरै मापदण्डहरू हाइलाइट गर्यो जसमा एआई मोडेलहरूको क्षमतालाई सहयोग गर्न वा चलिरहेका साइबर आक्रमणहरूमाथि स्वायत्तरूपमा कार्य गर्न, रासायनिक, जैविक, रेडियोलोजिकल र सिर्जना गर्ने ज्ञानको सिर्जना वा वृद्धि गर्न मद्दत गर्ने मोडेलहरूको क्षमता समावेश छ। यसका साथै आणविक जोखिम, राष्ट्रिय सुरक्षा जोखिम मूल्यांकन, र अन्य विषयहरु समेत समावेश रहेका छन्।

उन्नत क्षमताहरूको सन्दर्भमा, बेन्चमार्कहरू वैज्ञानिक अनुसन्धान, सहभागिता र हानिकारकता तर्फ अस्वीकार, र बहुभाषी क्षमताहरू परिवर्तन गर्न एआईको क्षमताको मूल्याङ्कन गर्न सक्षम हुनुपर्नेमा एन्थ्रोपिकले हाइलाइट गर्यो।

यसबाहेक, एआई फर्मले समाजलाई प्रभाव पार्ने एआई मोडेलको सम्भाव्यता बुझ्न आवश्यक भएको बतायो। यसका लागि, मूल्याङ्कनहरूले “हानिकारक पूर्वाग्रह, भेदभाव, अति निर्भरता, संलग्नता, मनोवैज्ञानिक प्रभाव, आर्थिक प्रभावहरू, एकरूपता, र अन्य व्यापक सामाजिक प्रभावहरू” जस्ता अवधारणाहरूलाई लक्षित गर्न सक्षम हुनुपर्छ।

यसैगरी, एआई फर्मले राम्रो मूल्याङ्कनका लागि केही सिद्धान्तहरू पनि सूचीबद्ध गरेको छ। यसले भनेको छ कि एआईद्वारा प्रयोग गरिएको प्रशिक्षण डाटामा मूल्याङ्कनहरू उपलब्ध हुनु हुँदैन किनभने यो प्राय: मोडेलहरूको लागि स्मरण परीक्षणमा परिणत हुन्छ। यसले एआई परीक्षण गर्न १ हजारदेखि १० हजार कार्यहरू वा प्रश्नहरू बीचमा राख्न प्रोत्साहित गर्यो।

यसले संगठनहरूलाई विषयवस्तु विशेषज्ञहरू प्रयोग गर्नका लागि कार्यहरू सिर्जना गर्न पनि आग्रह गर्यो जसले विशिष्ट डोमेनमा प्रदर्शन परीक्षण गर्दछ।

प्रकाशित: १९ असार २०८१, बुधबार