Lar Notícias A acessibilidade do Deepseek é um mito: a IA revolucionária realmente custou US $ 1,6 bilhão para se desenvolver

A acessibilidade do Deepseek é um mito: a IA revolucionária realmente custou US $ 1,6 bilhão para se desenvolver

Autor : Lucy Feb 21,2025

O modelo de IA surpreendentemente barato de Deepseek desafia os gigantes da indústria. A empresa afirma ter treinado sua poderosa rede neural Deepseek V3 por meros US $ 6 milhões, utilizando apenas 2048 GPUs, um forte contraste com os custos significativamente mais altos dos concorrentes. No entanto, esse número é enganoso.

A auto-introdução de Deepseek: "Oi, fui criado para que você possa perguntar qualquer coisa e obter uma resposta que possa até surpreendê-lo", sugere as capacidades do modelo, que causaram uma grande queda no preço das ações da NVIDIA. O sucesso do modelo deriva de tecnologias inovadoras:

Previsão com vários toques (MTP): Prevendo várias palavras simultaneamente, aumentando a precisão e a eficiência.
Mistura de especialistas (MOE): Emprega 256 redes neurais, ativando oito para cada token, acelerando treinamento e desempenho.
Atenção latente de várias cabeças (MLA): Extrai repetidamente os principais detalhes, minimizando a perda de informações e aprimorando a compreensão das nuances.

DeepSeek Test imagem: ensigame.com

Apesar da reivindicação de baixo custo de treinamento, um relatório de semiânica revela a infraestrutura substancial da Deepseek: aproximadamente 50.000 GPUs NVIDIA Hopper (incluindo H800, H100 e H20) se espalham por vários data centers, custando cerca de US $ 1,6 bilhão. As despesas operacionais são estimadas em US $ 944 milhões.

DeepSeek V3 imagem: ensigame.com

A Deepseek, uma subsidiária da High-Flyer, um fundo de hedge chinês, possui seus data centers, diferentemente dos concorrentes dependentes da nuvem. Isso fornece maior controle e inovação mais rápida. A auto-financiamento da empresa promove agilidade. Altos salários (mais de US $ 1,3 milhão anualmente para alguns pesquisadores) atraem os principais talentos chineses, excluindo especialistas estrangeiros.

DeepSeek imagem: ensigame.com

O número de US $ 6 milhões abrange apenas o uso de GPU pré-treinamento, excluindo pesquisas, refinamento, processamento de dados e infraestrutura. O investimento total de IA da Deepseek excede US $ 500 milhões. Sua estrutura enxuta facilita a inovação eficiente.

DeepSeek imagem: ensigame.com

O sucesso da Deepseek demonstra uma capacidade independente de IA bem financiada de competir com jogadores estabelecidos. No entanto, sua reivindicação "amiga do orçamento" é exagerada; Bilhões em investimento, avanços técnicos e uma equipe forte são fatores -chave. O contraste é Stark: o R1 da Deepseek custou US $ 5 milhões, enquanto o ChatGPT-4 custa US $ 100 milhões, destacando a diferença de custo significativa. Apesar da reivindicação inflada, o custo da Deepseek permanece substancialmente menor que seus concorrentes.

Últimos artigos

Crunchyroll lança adaptação móvel do jogo de "Sala de Aula da Elite" em seu catálogo

O Vault de Jogos da Crunchyroll no Android acaba de dar as boas-vindas a um novo título: Classroom of the Elite, uma adaptação móvel da renomada série de romances de Shōgo Kinugasa. Assim como a obra original, o jogo o lança diretamente no meio da po

by Harper Apr 09,2026
Gears of War: E-Day omitido no evento da Xbox, com lançamento previsto para 2026

Se você estava ansiosamente aguardando notícias sobre Gears of War: E-Day durante o Xbox Games Showcase 2025, prepare-se para a decepção. As grandes franquias da Microsoft ficaram em segundo plano este ano — nenhuma atualização foi divulgada para For

by Andrew Apr 05,2026