ডিপসেকের আশ্চর্যজনকভাবে সস্তা এআই মডেল শিল্প জায়ান্টদের চ্যালেঞ্জ জানায়। সংস্থাটি দাবি করেছে যে তার শক্তিশালী ডিপসেক ভি 3 নিউরাল নেটওয়ার্ককে মাত্র million মিলিয়ন ডলারে প্রশিক্ষণ দিয়েছে, যা কেবলমাত্র 2048 জিপিইউ ব্যবহার করে, প্রতিযোগীদের উল্লেখযোগ্যভাবে উচ্চ ব্যয়ের সম্পূর্ণ বিপরীতে। তবে এই চিত্রটি বিভ্রান্তিকর।
ডিপসিকের স্ব-অনুপ্রবেশ: "হাই, আমি তৈরি হয়েছিল যাতে আপনি কিছু জিজ্ঞাসা করতে পারেন এবং এমন একটি উত্তর পেতে পারেন যা আপনাকে অবাক করে দিতে পারে," মডেলের সক্ষমতাগুলিতে ইঙ্গিত দেয়, যা এনভিডিয়ার শেয়ারের দামে একটি বড় ডুব সৃষ্টি করেছে। মডেলের সাফল্য উদ্ভাবনী প্রযুক্তি থেকে উদ্ভূত:
- মাল্টি-টোকেন পূর্বাভাস (এমটিপি): একসাথে একাধিক শব্দের পূর্বাভাস দেয়, নির্ভুলতা এবং দক্ষতা বাড়িয়ে তোলে।
- বিশেষজ্ঞদের মিশ্রণ (এমওই): প্রতিটি টোকেনের জন্য আটটি সক্রিয় করে, প্রশিক্ষণ এবং কর্মক্ষমতা ত্বরান্বিত করে 256 নিউরাল নেটওয়ার্ক নিয়োগ করে।
- মাল্টি-হেডের সুপ্ত মনোযোগ (এমএলএ): বারবার মূল বিবরণগুলি আহরণ করে, তথ্য ক্ষতি হ্রাস করে এবং উপদ্রব বোঝার বর্ধন করে।
%আইএমজিপি%চিত্র: ensigame.com
কম প্রশিক্ষণ ব্যয়ের দাবি সত্ত্বেও, একটি অর্ধবৃত্তীয় প্রতিবেদনে ডিপসিকের যথেষ্ট অবকাঠামো প্রকাশ করা হয়েছে: প্রায় 50,000 এনভিডিয়া হপার জিপিইউ (এইচ 800, এইচ 100, এবং এইচ 20 ইউনিট সহ) একাধিক ডেটা সেন্টারে ছড়িয়ে পড়ে, প্রায় 1.6 বিলিয়ন ডলার ব্যয় করে। অপারেশনাল ব্যয় অনুমান করা হয় $ 944 মিলিয়ন।
%আইএমজিপি%চিত্র: ensigame.com
চীনা হেজ তহবিল হাই-ফ্লায়ারের সহায়ক সংস্থা ডিপসেক তার ডেটা সেন্টারগুলির মালিক, মেঘ-নির্ভরশীল প্রতিযোগীদের বিপরীতে। এটি বৃহত্তর নিয়ন্ত্রণ এবং দ্রুত উদ্ভাবন সরবরাহ করে। কোম্পানির স্ব-তহবিল তত্পরতা বাড়িয়ে তোলে। উচ্চ বেতন (কিছু গবেষকের জন্য বার্ষিক ১.৩ মিলিয়ন ডলারেরও বেশি) বিদেশী বিশেষজ্ঞদের বাদ দিয়ে শীর্ষ চীনা প্রতিভা আকর্ষণ করে।
%আইএমজিপি%চিত্র: ensigame.com
$ 6 মিলিয়ন চিত্রটি কেবল গবেষণা, পরিমার্জন, ডেটা প্রসেসিং এবং অবকাঠামো বাদ দিয়ে প্রাক-প্রশিক্ষণ জিপিইউ ব্যবহারকে কভার করে। ডিপসেকের মোট এআই বিনিয়োগ $ 500 মিলিয়ন ছাড়িয়েছে। এর পাতলা কাঠামো দক্ষ উদ্ভাবনকে সহায়তা করে।
%আইএমজিপি%চিত্র: ensigame.com
ডিপসিকের সাফল্য প্রতিষ্ঠিত খেলোয়াড়দের সাথে প্রতিযোগিতা করার জন্য একটি সু-অর্থায়িত স্বতন্ত্র এআই কোম্পানির দক্ষতা প্রদর্শন করে। তবে এর "বাজেট-বান্ধব" দাবি অতিরঞ্জিত; বিলিয়ন বিলিয়ন বিনিয়োগ, প্রযুক্তিগত অগ্রগতি এবং একটি শক্তিশালী দল মূল কারণ। বৈসাদৃশ্যটি সম্পূর্ণ: ডিপসেকের আর 1 এর জন্য 5 মিলিয়ন ডলার ব্যয় হয়েছে, যখন চ্যাটজিপিটি -4 এর ব্যয় $ 100 মিলিয়ন ডলার, উল্লেখযোগ্য ব্যয়ের পার্থক্যটি তুলে ধরে। স্ফীত দাবি সত্ত্বেও, ডিপসিকের ব্যয় তার প্রতিযোগীদের তুলনায় যথেষ্ট কম থাকে।