Deepseeks überraschend kostengünstige KI -Modell stellt die Branchenriesen heraus. Das Unternehmen behauptet, sein leistungsstarkes Neuralnetz aus Deepseek V3 für nur 6 Millionen US -Dollar ausgebildet zu haben, wobei nur 2048 GPUs ein starker Kontrast zu den deutlich höheren Kosten der Wettbewerber verwendet wurden. Diese Zahl ist jedoch irreführend.
Deepseeks Selbsteinführung: "Hallo, ich wurde erstellt, damit Sie alles fragen und eine Antwort erhalten können, die Sie sogar überraschen könnte." Der Erfolg des Modells beruht auf innovativen Technologien:
- Multi-Soury Prediction (MTP): sagt mehrere Wörter gleichzeitig voraus, steigern Sie die Genauigkeit und Effizienz.
- Mischung aus Experten (MOE): beschäftigt 256 neuronale Netze, die acht für jedes Token aktiviert und Schulungen und Leistung beschleunigt. .
Bild: Ensigame.com
Trotz des günstigen Ausbildungskostenanspruchs zeigt ein semianalysatischer Bericht die wesentliche Infrastruktur von Deepseek: ca. 50.000 NVIDIA Hopper -GPUs (einschließlich H800-, H100- und H20 -Einheiten), die über mehrere Rechenzentren in Höhe von mehr als 1,6 Milliarden US -Dollar kosteten. Die Betriebskosten werden auf 944 Mio. USD geschätzt.
Bild: Ensigame.com
Deepseek, eine Tochtergesellschaft von High-Flyer, einem chinesischen Hedgefonds, besitzt im Gegensatz zu Cloud-abhängigen Wettbewerbern seine Rechenzentren. Dies bietet eine größere Kontrolle und schnellere Innovation. Die Selbstfinanzierung des Unternehmens fördert die Beweglichkeit. Hohe Gehälter (über 1,3 Millionen US -Dollar pro Jahr für einige Forscher) ziehen erstklassige chinesische Talente an, ohne ausländische Spezialisten.
Bild: Ensigame.com
Die 6-Millionen-Dollar-Zahl deckt nur die Nutzung der GPU-Nutzung vor dem Training ab und ohne Forschung, Verfeinerung, Datenverarbeitung und Infrastruktur. Die Gesamtinvestition von Deepseek übersteigt 500 Millionen US -Dollar. Seine magere Struktur erleichtert effiziente Innovation.
Bild: Ensigame.com
Der Erfolg von Deepseek zeigt eine gut finanzierte unabhängige KI-Unternehmensfähigkeit, mit etablierten Spielern zu konkurrieren. Die "budgetfreundliche" Behauptung ist jedoch übertrieben; Milliarden an Investitionen, technischen Durchbrüchen und ein starkes Team sind Schlüsselfaktoren. Der Kontrast ist Stark: Deepseeks R1 kostete 5 Millionen US-Dollar, während Chatgpt-4 100 Millionen US-Dollar kostete, was den erheblichen Kostenunterschied hervorhebt. Trotz des aufgeblasenen Anspruchs bleibt die Kosten von Deepseek wesentlich niedriger als die Konkurrenten.