Deepseek'in şaşırtıcı derecede ucuz AI modeli endüstri devlerine meydan okuyor. Şirket, güçlü Deepseek V3 sinir ağını sadece 6 milyon dolar için eğittiğini iddia ediyor ve sadece 2048 GPU kullanıyor. Ancak, bu rakam yanıltıcıdır.
Deepseek'in kendi kendine giriş: "Merhaba, yaratıldım, böylece bir şey sorabilir ve sizi şaşırtabilecek bir cevap alabilirsiniz," modelin Nvidia'nın hisse senedi fiyatında büyük bir düşüşe neden olan yeteneklerini ima ediyor. Modelin başarısı yenilikçi teknolojilerden kaynaklanıyor:
- Çoklu atak tahmin (MTP): aynı anda birden fazla kelimeyi tahmin ederek doğruluğu ve verimliliği artırır.
- Uzmanların Karışımı (MOE): 256 sinir ağı kullanır, her jeton için sekiz'i aktive eder, eğitim ve performansı hızlandırır.
- Çok Başlı Gizli Dikkat (MLA): Tekrar tekrar anahtar ayrıntıları çıkarır, bilgi kaybını en aza indirir ve nüans anlayışını geliştirir.
%İmgp%resim: ensigame.com
Düşük eğitim maliyeti iddiasına rağmen, bir yarı adaliz raporu Deepseek'in önemli altyapısını ortaya koymaktadır: yaklaşık 50.000 NVIDIA Hopper GPU'ları (H800, H100 ve H20 birimleri dahil), birden fazla veri merkezine yayılmış ve yaklaşık 1,6 milyar dolara mal olur. Operasyonel giderlerin 944 milyon dolar olduğu tahmin ediliyor.
%İmgp%resim: ensigame.com
Bir Çin Hedge Fonu olan High-Flyer'in bir yan kuruluşu olan Deepseek, buluta bağlı rakiplerin aksine veri merkezlerinin sahibi. Bu daha fazla kontrol ve daha hızlı yenilik sağlar. Şirketin kendini finanse eden çevikliği teşvik ediyor. Yüksek maaşlar (bazı araştırmacılar için yıllık 1,3 milyon doların üzerinde) yabancı uzmanlar hariç en iyi Çin yeteneklerini çekiyor.
%İmgp%resim: ensigame.com
6 milyon dolarlık rakam, araştırma, arıtma, veri işleme ve altyapı hariç, yalnızca eğitim öncesi GPU kullanımını kapsamaktadır. Deepseek'in toplam AI yatırımı 500 milyon doları aşıyor. Yalın yapısı verimli yeniliği kolaylaştırır.
%İmgp%resim: ensigame.com
Deepseek'in başarısı, iyi finanse edilen bağımsız bir AI şirketinin yerleşik oyuncularla rekabet etme yeteneğini göstermektedir. Ancak, "bütçe dostu" iddiası abartılıdır; Milyarlarca yatırım, teknik atılımlar ve güçlü bir ekip kilit faktörlerdir. Kontrast sade: Deepseek'in R1'in maliyeti 5 milyon dolara, Chatgpt-4'ün maliyeti 100 milyon dolara mal oluyor ve önemli maliyet farkını vurguluyor. Şişirilmiş iddiaya rağmen, Deepseek'in maliyeti rakiplerinden önemli ölçüde daha düşüktür.