नई दिल्ली, आईएएनएस।
आर्टिफिशियल इंटेलिजेंस (एआई) के बढ़ते ट्रेंड के बीच एलन मस्क के स्वामित्व वाले 'ग्रोक' और चीन के 'डीपसीक' मॉडल अब एआई क्षमता के मामले में सबसे आगे बने हुए हैं। रविवार को जारी एक रिपोर्ट के अनुसार, जहां एक मॉडल एक्सेसिबिलिटी और एफिशिएंसी के मामले में बेहतर है, वहीं दूसरा वृहत पैमाने के मामले में। हालांकि, दोनों ही मॉडल के प्रशिक्षण के संसाधनों में काफी भिन्नता है।
ग्रोक-3 पैमाने के मामले में कोई समझौता नहीं करता
काउंटरपॉइंट रिसर्च के अनुसार, ग्रोक-3 पैमाने के मामले में कोई समझौता नहीं करता। उसके पास दो लाख एनवीडिया एच100 (टेंसर कोर जीपीयू) का समर्थन है। वहीं, डीपसीक-आर1 उसके मुकाबले बेहद छोटे हिस्से का इस्तेमाल करके भी उसे चुनौती दे रहा है, जो दर्शाता है कि नवाचारी आर्टिटेक्चर और क्यूरेशन वृहद इंफ्रास्ट्रक्चर को टक्कर दे सकते हैं।
डीपसीक ने फरवरी में अपने फ्लैगशिप रीजनिंग मॉडल डीपसीक-आर1 को ओपनसोर्स कर वैश्विक स्तर पर सुर्खियां बटोरनी शुरू की थी। यह मॉडल दुनिया के फ्रंटियर रीजनिंग मॉडल के बराबर परफॉर्मेंस डिलीवर करता है।
दक्षता के मामले में एक मास्टरक्लास
काउंटरपॉइंट में एआई के प्रमुख विश्लेषक वेई सन ने कहा, "इसकी खासियत केवल इसकी बेहतरीन क्षमताएं ही नहीं हैं, बल्कि यह तथ्य भी है कि इसे केवल दो हजार एनवीडिया एच800 जीपीयू का इस्तेमाल कर ट्रेन किया गया था, जो H100 का एक छोटा और निर्यात-अनुरूप विकल्प है, जो इसकी उपलब्धि को दक्षता के मामले में एक मास्टरक्लास बनाता है।"
अब तक का सबसे एडवांस मॉडल
मस्क के एक्सएआई ने ग्रोक-3 को पेश किया, जो इसका अब तक का सबसे एडवांस मॉडल है। यह मॉडल डीपसीक-आर1, ओपनएआई के जीपीटी-ओ1 और गूगल के जेमिनी 2 से बेहतर परफॉर्मेंस डिलीवर करता है।
"डीपसीक-आर1
सन ने कहा, "डीपसीक-आर1 से अलग, ग्रोक-3 को एक्सएआई के सुपरकंप्यूटर कलॉसस पर दो लाख एच100 जीपीयू का इस्तेमाल कर ट्रेनिंग दी गई है।" ग्रोक-3 वृहत पैमाने की रणनीति का प्रतीक है, विशाल कम्प्यूट स्केल (जीपीयू लागत में अरबों डॉलर का प्रतिनिधित्व करता है) बढ़ते प्रदर्शन लाभ को प्रोत्साहित करता है। यह एक ऐसा रूट है जिसे केवल सबसे धनी तकनीकी दिग्गज या सरकारें ही वास्तविक में साकार कर सकती हैं।
एल्गोरिदमिक सरलता
सन ने बताया, "इसके विपरीत, डीपसीक-आर1, मिक्सचर-ऑफ-एक्सपर्ट्स (एमओई) और रीजनिंग के लिए रीइन्फोर्समेंट लर्निंग जैसी तकनीकों का लाभ उठाकर, क्यूरेटेड और उच्च-गुणवत्ता वाले डेटा के साथ मिलकर, कम्प्यूट के एक फ्रैक्शन के साथ तुलनात्मक परिणाम प्राप्त करने के लिए एल्गोरिदमिक सरलता की शक्ति को प्रदर्शित करता है।"
ग्रोक-3 साबित करता है कि 100 गुना अधिक जीपीयू लगाने से प्रदर्शन में सीमांत लाभ तेजी से मिल सकता है। लेकिन यह निवेश पर तेजी से घटते रिटर्न (आरओआई) को भी उजागर करता है। रिपोर्ट में कहा गया है कि डीपसीक-आर1 न्यूनतम हार्डवेयर ओवरहेड के साथ बेहतरीन प्रदर्शन प्राप्त करने से जुड़ा है, जबकि ग्रोक-3 किसी भी आवश्यक कम्प्यूटेशनल माध्यम से सीमाओं को तोड़कर आगे बढ़ने से जुड़ा है।