Lar > Notícias > O desenvolvimento de US $ 1,6 bilhão da Deepseek desmascarou

O desenvolvimento de US $ 1,6 bilhão da Deepseek desmascarou

Mar 13,25(11 meses atrás)
O desenvolvimento de US $ 1,6 bilhão da Deepseek desmascarou

O novo chatbot de Deepseek possui uma introdução impressionante: "Oi, fui criado para que você possa perguntar qualquer coisa e obter uma resposta que possa até surpreendê -lo". Esta IA, um produto da startup chinesa Deepseek, tornou -se rapidamente um grande concorrente de mercado, contribuindo para uma queda significativa no preço das ações da NVIDIA. Seu sucesso decorre de uma metodologia exclusiva de arquitetura e treinamento que incorpora várias tecnologias inovadoras.

Previsão com vários toques (MTP): Ao contrário da previsão tradicional de palavra por palavra, o MTP prevê várias palavras simultaneamente, analisando peças de frase diferentes para maior precisão e eficiência.

Mistura de especialistas (MOE): Esta arquitetura aproveita várias redes neurais para processar dados de entrada, acelerando o treinamento de IA e melhorando o desempenho. O Deepseek V3 utiliza 256 redes neurais, ativando oito para cada tarefa de processamento de token.

Atenção latente de várias cabeças (MLA): Esse mecanismo se concentra nas peças cruciais da frase, extraindo repetidamente os principais detalhes dos fragmentos de texto para minimizar a perda de informações e capturar nuances sutis.

A Deepseek alegou inicialmente ter treinado sua poderosa rede neural Deepseek V3 por meros US $ 6 milhões usando apenas 2048 GPUs. No entanto, a semiânica revelou uma infraestrutura muito mais substancial: aproximadamente 50.000 GPUs NVIDIA Hopper, incluindo 10.000 H800s, 10.000 H100s e GPUs H20 adicionais, distribuídos por vários data centers. Isso se traduz em um investimento em servidor de aproximadamente US $ 1,6 bilhão e despesas operacionais estimadas em US $ 944 milhões.

A Deepseek, uma subsidiária do fundo de hedge chinês, possui seus data centers, concedendo controle completo sobre a otimização do modelo de IA e uma implementação mais rápida da inovação. Essa abordagem autofinanciada aumenta a flexibilidade e a velocidade de tomada de decisão. Além disso, a empresa atrai os melhores talentos, com alguns pesquisadores ganhando mais de US $ 1,3 milhão anualmente, principalmente das universidades chinesas.

Embora a reivindicação inicial de custo de treinamento de US $ 6 milhões da Deepseek pareça irrealista-referindo-se apenas para pré-treinamento de uso da GPU e excluir pesquisas, refinamento, processamento de dados e infraestrutura-a empresa investiu mais de US $ 500 milhões em desenvolvimento de IA. Sua estrutura compacta facilita a implementação eficiente da inovação em comparação com concorrentes maiores e mais burocráticos.

O exemplo da Deepseek mostra uma empresa independente de IA bem financiada competindo com sucesso com gigantes do setor. No entanto, seu sucesso está inegavelmente ligado a investimentos substanciais, avanços técnicos e uma equipe forte, fazendo com que o "orçamento revolucionário" afirme um pouco enganoso. No entanto, os custos da empresa permanecem significativamente menores que os concorrentes; Por exemplo, a Deepseek gastou US $ 5 milhões em R1, enquanto o ChatGPT4 custou US $ 100 milhões. Essa diferença de custo, mesmo considerando as despesas reais da Deepseek, destaca uma vantagem competitiva significativa.

Teste DeepseekDeepseek v3DeepseekDeepseek

Descobrir
  • jogos de arma tiro 3d offline
    jogos de arma tiro 3d offline
    Entre no mundo emocionante de jogos de tiroteio offline e FPS com Gun Games Offline: Goli Game. Encare missões cheias de ação e prove-se como o comandante definitivo neste shooter de aventura top de 2022. Mergulhe em intensas partidas de morte por eq
  • Tonk Offline
    Tonk Offline
    Tonk Offline é um emocionante e dinâmico jogo de cartas que está conquistando a Play Store. Frequentemente comparado ao Rummy e também conhecido como Knock Rummy 500, este favorito americano oferece nuances únicas como Knock & No Knock, proporcionand
  • Who is Die: Stickman Games
    Who is Die: Stickman Games
    Mergulhe em um mundo de suspense e comédia com "Who Dies First"—um emocionante novo jogo de entretenimento que combina aventuras de desembarque de personagens em bastão cheias de ação e física de bonecos de pano que o cativarão por horas. Explore cen
  • Never Lose! Squid Hero-Chan VS Absolutely Squid Tentacles
    Never Lose! Squid Hero-Chan VS Absolutely Squid Tentacles
    Embarque em um confronto épico em Never Lose! Squid Hero-Chan VS Absolutely Squid Tentacles, onde você batalhará astutamente contra oponentes formidáveis em uma guerra de lulas em ritmo acelerado. Navegue por cenários de combate intensos e estratégi
  • Luck Case
    Luck Case
    Mergulhe em uma aventura emocionante em um mundo de sorte e acaso com este aplicativo cativante. Luck Case oferece a oportunidade de testar sua sorte e descobrir se você tem o que é preciso para sair vitorioso. Com possibilidades ilimitadas e desafio
  • Imperial Checkers
    Imperial Checkers
    Imperial Checkers é o aplicativo líder para entusiastas de damas, reunindo um mundo de regras internacionais em uma única plataforma conveniente. Explore desde as clássicas damas internacionais até variações distintas alemãs e ucranianas, permitindo