Le coût de développement de 1,6 milliard de dollars de Deepseek a démystifié

Le nouveau chatbot de Deepseek possède une introduction impressionnante: "Salut, j'ai été créé pour que vous puissiez demander n'importe quoi et obtenir une réponse qui pourrait même vous surprendre." Cette IA, un produit de la startup chinoise Deepseek, est rapidement devenue un concurrent majeur du marché, contribuant même à une baisse significative du cours des actions de NVIDIA. Son succès provient d'une méthodologie d'architecture et de formation unique incorporant plusieurs technologies innovantes.
Prédiction multi-token (MTP): Contrairement à la prédiction traditionnelle mot par mot, MTP prévoit plusieurs mots simultanément, en analysant différentes parties de phrases pour une précision et une efficacité améliorées.
Mélange d'experts (MOE): Cette architecture exploite plusieurs réseaux de neurones pour traiter les données d'entrée, accélérer la formation d'IA et améliorer les performances. Deepseek V3 utilise 256 réseaux de neurones, activant huit pour chaque tâche de traitement de jeton.
Attention latente multi-tête (MLA): Ce mécanisme se concentre sur les parties cruciales de la phrase, extrait à plusieurs reprises les détails clés des fragments de texte pour minimiser la perte d'informations et capturer des nuances subtiles.
Deepseek a initialement affirmé avoir formé son puissant réseau neuronal Deepseek V3 pour seulement 6 millions de dollars en utilisant seulement 2048 GPU. Cependant, la semianalyse a révélé une infrastructure beaucoup plus substantielle: environ 50 000 GPU de trémie NVIDIA, dont 10 000 H800, 10 000 H100 et des GPU H20 supplémentaires, distribués dans plusieurs centres de données. Cela se traduit par un investissement de serveur d'environ 1,6 milliard de dollars et les dépenses opérationnelles estimées à 944 millions de dollars.
Deepseek, une filiale du High Flyer de fonds spéculatifs chinois, possède ses centres de données, accordant un contrôle complet sur l'optimisation des modèles d'IA et la mise en œuvre plus rapide de l'innovation. Cette approche autofinancée améliore la flexibilité et la vitesse de prise de décision. En outre, la société attire les meilleurs talents, certains chercheurs gagnant plus de 1,3 million de dollars par an, principalement des universités chinoises.
Alors que la réclamation de coûts de formation initiale de 6 millions de dollars de Deepseek semble irréaliste - ne référence qu'à l'utilisation du GPU avant la formation et à l'exclusion de la recherche, du raffinement, du traitement des données et des infrastructures - la société a investi plus de 500 millions de dollars dans le développement de l'IA. Sa structure compacte facilite une mise en œuvre efficace de l'innovation par rapport aux concurrents plus grands et plus bureaucratiques.
L'exemple de Deepseek présente une entreprise d'IA indépendante bien financée en concurrence avec succès avec les géants de l'industrie. Cependant, son succès est indéniablement lié à des investissements substantiels, à des percées techniques et à une équipe solide, ce qui rend le "budget révolutionnaire" quelque peu trompeur. Néanmoins, les coûts de l'entreprise restent nettement inférieurs à ceux des concurrents; Par exemple, Deepseek a dépensé 5 millions de dollars pour R1, tandis que ChatGpt4 a coûté 100 millions de dollars. Cette différence de coût, même en considérant les dépenses réelles de Deepseek, met en évidence un avantage concurrentiel important.
-
Coiffures de mariageDécouvrez votre coiffure de mariage de rêve avec l'éditeur de photos de coiffures de mariage! Bienvenue dans le monde des coiffures de mariage, où vous pouvez transformer vos photos de mariée en superbes chefs-d'œuvre avec seulement quelques robinets. Notre application est un éditeur de photos de mariée polyvalent qui vous permet d'ajouter une variété de belles
-
Whack Whack WarPréparez-vous pour une nouvelle aventure exaltante avec ** Whack War War **, un jeu non seulement extrêmement addictif mais aussi incroyablement facile à plonger avec ses adorables graphismes et ses commandes intuitives. Entrez dans l'arène passionnante, où vous prendrez le commandement de votre héros et vous lancerez dans une mission
-
Army Bomb Games 3D Nuclear WarLe simulateur de bombes nucléaires et la bombe désamorcent 3D: Bomb Blast & Nuclear Bomb Bomb. Profitons de la bombe désamorcée par le multijoueur hors ligne de bombes nucléaires, introduite avec une équipe Defise de bombe dans un incroyable jeux Nuke Bomb. Téléchargez le jeu de la bombe Defise et faites attention à l'attaque de la bombe atomique pour
-
One Lab - Artful Photo EditorDébusez votre créativité avec Onelab - Éditeur de photos artisanales, une application révolutionnaire qui offre une multitude de possibilités graphiques à portée de main. De la simple édition de photos à l'art pédagogique, à la baisse de la mentalité, aux distorsions d'image, à la génération de procédures et à la manipulation 3D, cette application est un trésor pour artis
-
LEGO DUPLO WORLDLego Duplo World n'est pas seulement un jeu régulier; Il s'agit d'une plate-forme engageante et éducative conçue spécifiquement pour les enfants. Avec un vaste monde à explorer rempli d'animaux colorés, de bâtiments, de véhicules et de trains en morceaux LEGO, les enfants participent à une expérience interactive et stimulante. T
-
Doppelgangers - find your twinLibérez le plaisir de trouver votre sosie parfaite avec nos doppelgangers - trouvez votre application jumelle! Commencez votre voyage en téléchargeant l'application et en vous connectant sans effort avec votre méthode préférée. Une fois que vous êtes dans, prenez un selfie clair, en vous assurant que tout est à propos de vous - aucune distraction nécessaire. Notre Edg de pointe
-
Infinity Nikki: Nouveaux codes de réévaluation pour janvier 2025 Sortie!
-
GBA réinventé : un joueur reconstruit Mario 64 pour ordinateur de poche
-
Mobile sombre et plus sombre: nouveaux contenus et mises à jour de la qualité de vie
-
Dracula évoque une terreur impie à Storyngton Hall
-
Les Crocs de marque Pokémon présentent des modèles populaires de génération 1