Il costo di sviluppo di $ 1,6 miliardi di Deepseek ha sfatato

Il nuovo chatbot di Deepseek vanta un'impressionante introduzione: "Ciao, sono stato creato in modo da poter chiedere qualsiasi cosa e ottenere una risposta che potrebbe persino sorprenderti." Questa intelligenza artificiale, un prodotto della startup cinese Deepseek, è rapidamente diventata un importante concorrente del mercato, contribuendo anche a un calo significativo del prezzo delle azioni di Nvidia. Il suo successo deriva da una metodologia di architettura e formazione unica che incorpora diverse tecnologie innovative.
Previsione multi-token (MTP): a differenza della previsione tradizionale di parole per parola, MTP prevede contemporaneamente più parole, analizzando diverse frasi per una maggiore precisione ed efficienza.
Miscela di esperti (MOE): questa architettura sfrutta più reti neurali per elaborare i dati di input, accelerare la formazione dell'IA e migliorare le prestazioni. DeepSeek V3 utilizza 256 reti neurali, attivando otto per ciascuna attività di elaborazione dei token.
Attenzione latente multi-testa (MLA): questo meccanismo si concentra su parti cruciali delle frasi, estraendo ripetutamente i dettagli chiave dai frammenti di testo per ridurre al minimo la perdita di informazioni e acquisire sottili sfumature.
Deepseek inizialmente ha affermato di aver addestrato la sua potente rete neurale Deepseek V3 per soli $ 6 milioni utilizzando solo 2048 GPU. Tuttavia, la semianalisi ha rivelato un'infrastruttura molto più sostanziale: circa 50.000 GPU della tramoggia Nvidia, tra cui 10.000 H800, 10.000 H100 e GPU H20 aggiuntive, distribuite su più data center. Ciò si traduce in un investimento server di circa $ 1,6 miliardi e le spese operative stimate in $ 944 milioni.
DeepSeek, una consociata dell'hedge fund cinese High-Flyer, possiede i suoi data center, che concede un controllo completo sull'ottimizzazione del modello di intelligenza artificiale e sull'implementazione più rapida dell'innovazione. Questo approccio autofinanziato migliora la flessibilità e la velocità decisionale. Inoltre, la società attira i migliori talenti, con alcuni ricercatori che guadagnano oltre $ 1,3 milioni all'anno, principalmente dalle università cinesi.
Mentre la richiesta iniziale di costi di formazione di $ 6 milioni di Deepseek appare irrealistica, riferendosi solo all'utilizzo della GPU pre-allenamento ed escluso la ricerca, la raffinatezza, l'elaborazione dei dati e le infrastrutture-la società ha investito oltre 500 milioni di dollari nello sviluppo dell'intelligenza artificiale. La sua struttura compatta facilita un'implementazione di innovazione efficiente rispetto a concorrenti più grandi e burocratici.
L'esempio di Deepseek mostra una società di intelligenza artificiale indipendente ben finanziata con successo con i giganti del settore. Tuttavia, il suo successo è innegabilmente legato a investimenti sostanziali, scoperte tecniche e una squadra forte, che fa un po 'fuorviante la rivendicazione del "bilancio rivoluzionario". Tuttavia, i costi dell'azienda rimangono significativamente inferiori rispetto ai concorrenti; Ad esempio, DeepSeek ha speso $ 5 milioni in R1, mentre CHATGPT4 costa $ 100 milioni. Questa differenza di costo, anche considerando le spese effettive di DeepSeek, evidenzia un significativo vantaggio competitivo.
-
Wedding Hairstyles on photoScopri l'acconciatura da sposa dei tuoi sogni con l'editore fotografico delle acconciature da sposa! Benvenuti nel mondo delle acconciature da sposa, dove puoi trasformare le tue foto da sposa in splendidi capolavori con pochi tocchi. La nostra app è un versatile editor di foto da sposa che ti consente di aggiungere una varietà di belle
-
Whack Whack WarPreparati per una nuova esilarante avventura con ** Whack Whack War **, un gioco che non è solo selvaggiamente avvincente, ma anche incredibilmente facile da immergersi con i suoi adorabili grafici e controlli in-tap intuitivi. Entra nell'arena emozionante, dove prenderà il comando del tuo eroe e intraprenderai una missione
-
Army Bomb Games 3D Nuclear WarIl simulatore di bombe nucleari e la bomba disinvolgono 3D: bomba Blomer & Nuclear Bomb Games War. Godiamo di sfidare la bomba a disinnescare il multiplayer Offline 3D di bombe nucleari, introdotto con una squadra di disinvoltura di bombe in un incredibile bomba Nuke. Scarica il gioco DEUSUS bomba e fai attenzione all'attacco della bomba atomica a
-
One Lab - Artful Photo EditorScatena la tua creatività con OneLab - Editor fotografico abile, un'app rivoluzionaria che offre una vasta gamma di possibilità grafiche a portata di mano. Dal semplice fotoritocco all'arte per glitch per la mente, distorsioni dell'immagine, generazione procedurale e manipolazione 3D, questa app è un tesoro per Artis
-
LEGO DUPLO WORLDLego Duplo World non è solo un gioco normale; È una piattaforma coinvolgente ed educativa progettata specificamente per i bambini. Con un vasto mondo da esplorare pieni di animali colorati, edifici, veicoli e treni realizzati con pezzi Lego, i bambini hanno un'esperienza interattiva e stimolante. T
-
Doppelgangers - find your twinScatena il divertimento di trovare il tuo sosia perfetto con i nostri doppelganger: trova la tua app gemella! Inizia il tuo viaggio scaricando l'app e firmando senza sforzo con il tuo metodo preferito. Una volta entrato, scatta un selfie chiaro, assicurandoti che sia tutto su di te, non necessarie distrazioni. Il nostro taglio edg
-
Infinity Nikki: nuovi codici di riscatto per gennaio 2025 rilasciati!
-
GBA reinventato: il giocatore ricostruisce Mario 64 per il palmare
-
Mobile scuro e scuro: nuovi contenuti e aggiornamenti di qualità della vita
-
Dracula evoca il terrore empio a Storyington Hall
-
I Crocs a marchio Pokémon presentano design popolari di prima generazione