Le coût de développement de 1,6 milliard de dollars de Deepseek a démystifié
Le nouveau chatbot de Deepseek possède une introduction impressionnante: "Salut, j'ai été créé pour que vous puissiez demander n'importe quoi et obtenir une réponse qui pourrait même vous surprendre." Cette IA, un produit de la startup chinoise Deepseek, est rapidement devenue un concurrent majeur du marché, contribuant même à une baisse significative du cours des actions de NVIDIA. Son succès provient d'une méthodologie d'architecture et de formation unique incorporant plusieurs technologies innovantes.
Prédiction multi-token (MTP): Contrairement à la prédiction traditionnelle mot par mot, MTP prévoit plusieurs mots simultanément, en analysant différentes parties de phrases pour une précision et une efficacité améliorées.
Mélange d'experts (MOE): Cette architecture exploite plusieurs réseaux de neurones pour traiter les données d'entrée, accélérer la formation d'IA et améliorer les performances. Deepseek V3 utilise 256 réseaux de neurones, activant huit pour chaque tâche de traitement de jeton.
Attention latente multi-tête (MLA): Ce mécanisme se concentre sur les parties cruciales de la phrase, extrait à plusieurs reprises les détails clés des fragments de texte pour minimiser la perte d'informations et capturer des nuances subtiles.
Deepseek a initialement affirmé avoir formé son puissant réseau neuronal Deepseek V3 pour seulement 6 millions de dollars en utilisant seulement 2048 GPU. Cependant, la semianalyse a révélé une infrastructure beaucoup plus substantielle: environ 50 000 GPU de trémie NVIDIA, dont 10 000 H800, 10 000 H100 et des GPU H20 supplémentaires, distribués dans plusieurs centres de données. Cela se traduit par un investissement de serveur d'environ 1,6 milliard de dollars et les dépenses opérationnelles estimées à 944 millions de dollars.
Deepseek, une filiale du High Flyer de fonds spéculatifs chinois, possède ses centres de données, accordant un contrôle complet sur l'optimisation des modèles d'IA et la mise en œuvre plus rapide de l'innovation. Cette approche autofinancée améliore la flexibilité et la vitesse de prise de décision. En outre, la société attire les meilleurs talents, certains chercheurs gagnant plus de 1,3 million de dollars par an, principalement des universités chinoises.
Alors que la réclamation de coûts de formation initiale de 6 millions de dollars de Deepseek semble irréaliste - ne référence qu'à l'utilisation du GPU avant la formation et à l'exclusion de la recherche, du raffinement, du traitement des données et des infrastructures - la société a investi plus de 500 millions de dollars dans le développement de l'IA. Sa structure compacte facilite une mise en œuvre efficace de l'innovation par rapport aux concurrents plus grands et plus bureaucratiques.
L'exemple de Deepseek présente une entreprise d'IA indépendante bien financée en concurrence avec succès avec les géants de l'industrie. Cependant, son succès est indéniablement lié à des investissements substantiels, à des percées techniques et à une équipe solide, ce qui rend le "budget révolutionnaire" quelque peu trompeur. Néanmoins, les coûts de l'entreprise restent nettement inférieurs à ceux des concurrents; Par exemple, Deepseek a dépensé 5 millions de dollars pour R1, tandis que ChatGpt4 a coûté 100 millions de dollars. Cette différence de coût, même en considérant les dépenses réelles de Deepseek, met en évidence un avantage concurrentiel important.




-
Skin Bus Simulator IndonesiaTéléchargez la dernière livrée de simulateur de bus indonésien, avec de nouveaux camions à livrée 2022 pour BUSSID v3.7.Fans de livrées BUSSID v3.7, bienvenue dans le simulateur de bus indonésien 2022. Cette version vous propose une livrée complète d -
Sky WordsExplorez le monde à travers des jeux de mots ! Détendez votre esprit en trouvant des mots.Partez pour une aventure unique de jeu de mots, où l'excitation d'une recherche de mots rencontre le défi des mots croisés. Consacrez seulement 10 minutes par j -
Empire of BonesEmbarquez pour une aventure palpitante dans "Empire des Ossements", le tout nouveau jeu de cartes à collectionner d'un développeur renommé. Avec la lignée impériale en ruines, l'autrefois puissant empire de Tähn sombre dans le chaos. Rejoignez l'une -
YouWaifu Foxgil Konko – Fufect EditionAndoideEntrez dans l'univers serein et apaisant de YouWaifu Foxgil Konko – Fufect Edition, où vous pourrez vous connecter avec la charmante et délicieuse fille-renarde, Konko. Avec un doublage réaliste et une animation Live2D fluide, Konko paraît vraiment v -
ProMedica OnDemandBénéficiez d'une aide médicale quand et où vous en avez besoin avec ProMedica OnDemand. Cette application propose des consultations de santé virtuelles rapides, abordables et sécurisées. Connectez-vous avec des professionnels de santé 24h/24 et 7j/7 -
Spot the Differrence - IQ testMettez vos capacités d'observation à l'épreuve avec Spot the Difference - IQ Test, une application captivante conçue pour défier votre acuité visuelle et vos facultés cognitives. Tapez sur les différences entre deux images pour évaluer votre précisi
-
Crossage des animaux: Camp de poche complet - Comment déverrouiller le lobo
-
Meilleur MLB The Show 25 Diamond Dynasty Cards & Lineups (mars 2025)
-
Le DLC Veilguard retardé pour Mass Effect 5
-
Liste d'archero 2 niveaux - Classement les meilleurs personnages en février 2025
-
Les personnages originaux de Marvel vs Capcom 2 pourraient apparaître dans les jeux de combat Capcom