Lar > Notícias > O desenvolvimento de US $ 1,6 bilhão da Deepseek desmascarou

O desenvolvimento de US $ 1,6 bilhão da Deepseek desmascarou

Mar 13,25(1 meses atrás)
O desenvolvimento de US $ 1,6 bilhão da Deepseek desmascarou

O novo chatbot de Deepseek possui uma introdução impressionante: "Oi, fui criado para que você possa perguntar qualquer coisa e obter uma resposta que possa até surpreendê -lo". Esta IA, um produto da startup chinesa Deepseek, tornou -se rapidamente um grande concorrente de mercado, contribuindo para uma queda significativa no preço das ações da NVIDIA. Seu sucesso decorre de uma metodologia exclusiva de arquitetura e treinamento que incorpora várias tecnologias inovadoras.

Previsão com vários toques (MTP): Ao contrário da previsão tradicional de palavra por palavra, o MTP prevê várias palavras simultaneamente, analisando peças de frase diferentes para maior precisão e eficiência.

Mistura de especialistas (MOE): Esta arquitetura aproveita várias redes neurais para processar dados de entrada, acelerando o treinamento de IA e melhorando o desempenho. O Deepseek V3 utiliza 256 redes neurais, ativando oito para cada tarefa de processamento de token.

Atenção latente de várias cabeças (MLA): Esse mecanismo se concentra nas peças cruciais da frase, extraindo repetidamente os principais detalhes dos fragmentos de texto para minimizar a perda de informações e capturar nuances sutis.

A Deepseek alegou inicialmente ter treinado sua poderosa rede neural Deepseek V3 por meros US $ 6 milhões usando apenas 2048 GPUs. No entanto, a semiânica revelou uma infraestrutura muito mais substancial: aproximadamente 50.000 GPUs NVIDIA Hopper, incluindo 10.000 H800s, 10.000 H100s e GPUs H20 adicionais, distribuídos por vários data centers. Isso se traduz em um investimento em servidor de aproximadamente US $ 1,6 bilhão e despesas operacionais estimadas em US $ 944 milhões.

A Deepseek, uma subsidiária do fundo de hedge chinês, possui seus data centers, concedendo controle completo sobre a otimização do modelo de IA e uma implementação mais rápida da inovação. Essa abordagem autofinanciada aumenta a flexibilidade e a velocidade de tomada de decisão. Além disso, a empresa atrai os melhores talentos, com alguns pesquisadores ganhando mais de US $ 1,3 milhão anualmente, principalmente das universidades chinesas.

Embora a reivindicação inicial de custo de treinamento de US $ 6 milhões da Deepseek pareça irrealista-referindo-se apenas para pré-treinamento de uso da GPU e excluir pesquisas, refinamento, processamento de dados e infraestrutura-a empresa investiu mais de US $ 500 milhões em desenvolvimento de IA. Sua estrutura compacta facilita a implementação eficiente da inovação em comparação com concorrentes maiores e mais burocráticos.

O exemplo da Deepseek mostra uma empresa independente de IA bem financiada competindo com sucesso com gigantes do setor. No entanto, seu sucesso está inegavelmente ligado a investimentos substanciais, avanços técnicos e uma equipe forte, fazendo com que o "orçamento revolucionário" afirme um pouco enganoso. No entanto, os custos da empresa permanecem significativamente menores que os concorrentes; Por exemplo, a Deepseek gastou US $ 5 milhões em R1, enquanto o ChatGPT4 custou US $ 100 milhões. Essa diferença de custo, mesmo considerando as despesas reais da Deepseek, destaca uma vantagem competitiva significativa.

Teste DeepseekDeepseek v3DeepseekDeepseek

Descobrir
  • Penteados de casamento
    Penteados de casamento
    Descubra o penteado do casamento dos seus sonhos com o editor de fotos de penteados de casamento! Bem -vindo ao mundo dos penteados de casamento, onde você pode transformar suas fotos de noivas em obras -primas deslumbrantes com apenas algumas torneiras. Nosso aplicativo é um editor versátil de fotos de noiva que permite adicionar uma variedade de belas
  • Whack Whack War
    Whack Whack War
    Prepare-se para uma nova e emocionante aventura com ** Whack War **, um jogo que não é apenas muito viciante, mas também incrivelmente fácil de mergulhar com seus gráficos adoráveis ​​e controles intuitivos de um. Entre na arena emocionante, onde você assumirá o comando de seu herói e embarcará em uma missão
  • Army Bomb Games 3D Nuclear War
    Army Bomb Games 3D Nuclear War
    Simulador de bombas nucleares e contrapartida de bomba 3D: explosão de bombas e guerra de jogos de bombas nucleares. Vamos desfrutar de bombas que desabilitam os Jogos de Bombas Nucleares 3D Offline Multiplayer, introduzido com um esquadrão de defutação de bombas em um incrível jogo de bombas nucleares. Baixe o jogo de contrafuso de bomba e tenha cuidado com o ataque da bomba atômica a
  • One Lab - Artful Photo Editor
    One Lab - Artful Photo Editor
    Liberte sua criatividade com o OneLab - Artful Photo Editor, um aplicativo revolucionário que oferece uma riqueza de possibilidades gráficas na ponta dos dedos. Desde a simples edição de fotos até a arte alimentar da falha, distorções de imagens, geração processual e manipulação 3D, este aplicativo é um tesouro para o artis
  • LEGO DUPLO WORLD
    LEGO DUPLO WORLD
    O Lego Duplo World não é apenas um jogo regular; É uma plataforma envolvente e educacional projetada especificamente para crianças. Com um vasto mundo para explorar cheios de animais coloridos, edifícios, veículos e trens feitos de peças de Lego, as crianças têm uma experiência interativa e estimulante. T
  • Doppelgangers - find your twin
    Doppelgangers - find your twin
    Liberte a diversão de encontrar o seu parecido perfeito com nossos doppelgangers - encontre seu aplicativo gêmeo! Comece sua jornada baixando o aplicativo e assinando sem esforço com o seu método preferido. Depois de entrar, tire uma selfie clara, certificando -se de que é tudo sobre você - não é necessário distrações. Nosso edg de corte