दीपसेक की आश्चर्यजनक रूप से सस्ती एआई मॉडल चुनौतियां उद्योग के दिग्गजों को चुनौती देती हैं। कंपनी का दावा है कि उसने अपने शक्तिशाली दीपसेक वी 3 न्यूरल नेटवर्क को केवल $ 6 मिलियन के लिए प्रशिक्षित किया है, केवल 2048 जीपीयू का उपयोग करते हुए, प्रतियोगियों की काफी अधिक लागतों के विपरीत एक स्पष्ट है। हालांकि, यह आंकड़ा भ्रामक है।
डीपसेक का आत्म-परिचय: "हाय, मैं बनाया गया था ताकि आप कुछ भी पूछ सकें और एक उत्तर प्राप्त कर सकें जो आपको आश्चर्यचकित भी कर सकता है," मॉडल की क्षमताओं पर संकेत देता है, जिससे एनवीडिया के स्टॉक मूल्य में एक बड़ी डुबकी लगी है। मॉडल की सफलता अभिनव प्रौद्योगिकियों से उपजी है:
- मल्टी-टोकन भविष्यवाणी (एमटीपी): सटीकता और दक्षता को बढ़ावा देने के साथ, एक साथ कई शब्दों की भविष्यवाणी करता है।
- विशेषज्ञों का मिश्रण (एमओई): 256 तंत्रिका नेटवर्क को नियुक्त करता है, प्रत्येक टोकन के लिए आठ को सक्रिय करता है, प्रशिक्षण और प्रदर्शन को तेज करता है।
- मल्टी-हेड लेटेंट ध्यान (एमएलए): बार-बार प्रमुख विवरण निकालता है, सूचना हानि को कम करता है और बारीक समझ को बढ़ाता है।
छवि: ensigame.com
कम प्रशिक्षण लागत के दावे के बावजूद, एक सेमायनालिसिस रिपोर्ट में डीपसेक के पर्याप्त बुनियादी ढांचे का पता चलता है: लगभग 50,000 एनवीडिया हॉपर जीपीयू (एच 800, एच 100, और एच 20 यूनिट सहित) कई डेटा केंद्रों में फैले हुए हैं, जिनकी लागत लगभग 1.6 बिलियन डॉलर है। परिचालन व्यय $ 944 मिलियन का अनुमान है।
छवि: ensigame.com
एक चीनी हेज फंड, हाई-फ्लाइर की सहायक कंपनी दीपसेक, क्लाउड-रिलेटिक प्रतियोगियों के विपरीत, अपने डेटा केंद्रों का मालिक है। यह अधिक नियंत्रण और तेजी से नवाचार प्रदान करता है। कंपनी की स्व-फंडिंग फोस्टर चपलता है। उच्च वेतन (कुछ शोधकर्ताओं के लिए सालाना $ 1.3 मिलियन से अधिक) विदेशी विशेषज्ञों को छोड़कर, शीर्ष चीनी प्रतिभा को आकर्षित करते हैं।
छवि: ensigame.com
$ 6 मिलियन का आंकड़ा केवल पूर्व-प्रशिक्षण GPU उपयोग को शामिल करता है, अनुसंधान, शोधन, डेटा प्रसंस्करण और बुनियादी ढांचे को छोड़कर। दीपसेक का कुल एआई निवेश $ 500 मिलियन से अधिक है। इसकी दुबला संरचना कुशल नवाचार की सुविधा प्रदान करती है।
छवि: ensigame.com
दीपसेक की सफलता एक अच्छी तरह से वित्त पोषित स्वतंत्र एआई कंपनी की स्थापित खिलाड़ियों के साथ प्रतिस्पर्धा करने की क्षमता को प्रदर्शित करती है। हालाँकि, इसका "बजट-अनुकूल" दावा अतिरंजित है; निवेश, तकनीकी सफलताओं और एक मजबूत टीम में अरबों प्रमुख कारक हैं। इसके विपरीत स्टार्क है: डीपसेक के आर 1 की लागत $ 5 मिलियन है, जबकि चैट -4 की लागत $ 100 मिलियन है, जो महत्वपूर्ण लागत अंतर को उजागर करती है। फुलाए हुए दावे के बावजूद, डीपसेक की लागत अपने प्रतिद्वंद्वियों की तुलना में काफी कम है।