Deepseeks Entwicklungskosten von 1,6 Mrd. USD wurden entlarvt

Deepseeks neuer Chatbot bietet eine beeindruckende Einführung: "Hallo, ich wurde erstellt, damit Sie alles fragen und eine Antwort erhalten können, die Sie sogar überraschen könnte." Diese KI, ein Produkt des chinesischen Startups Deepseek, ist schnell zu einem wichtigen Marktkonkurrenten geworden, der sogar zu einem erheblichen Rückgang des Aktienkurs von NVIDIA beiträgt. Der Erfolg beruht auf einer einzigartigen Architektur- und Trainingsmethodik, die mehrere innovative Technologien einbezieht.
Multi-Token-Vorhersage (MTP): Im Gegensatz zur herkömmlichen Wort für Wortvorhersage prognostiziert MTP mehrere Wörter gleichzeitig und analysiert verschiedene Satzteile auf verbesserte Genauigkeit und Effizienz.
Mischung von Experten (MOE): Diese Architektur nutzt mehrere neuronale Netze, um Eingabedaten zu verarbeiten, das KI -Training zu beschleunigen und die Leistung zu verbessern. Deepseek V3 verwendet 256 neuronale Netze und aktiviert acht für jede Token -Verarbeitungsaufgabe.
Multi-Head Latent Achtung (MLA): Dieser Mechanismus konzentriert sich auf wichtige Satzteile und extrahiert wiederholt Schlüsseldetails aus Textfragmenten, um den Informationsverlust zu minimieren und subtile Nuancen zu erfassen.
Deepseek behauptete zunächst, sein leistungsstarkes Neuralnetz aus Deepseek V3 für nur 6 Millionen US -Dollar mit nur 2048 GPUs ausgebildet zu haben. Die semiianalyse ergab jedoch eine weitaus wesentlichere Infrastruktur: ungefähr 50.000 NVIDIA Hopper -GPUs, einschließlich 10.000 H800, 10.000 H100s und zusätzlicher H20 -GPUs, die über mehrere Rechenzentren verteilt sind. Dies führt zu einer Serverinvestition von rund 1,6 Milliarden US -Dollar und Betriebskosten, die auf 944 Mio. USD geschätzt werden.
Deepseek, eine Tochtergesellschaft des chinesischen Hedgefonds-High-Flyer, besitzt seine Rechenzentren und gewährt die vollständige Kontrolle über AI-Modelloptimierung und eine schnellere Implementierung von Innovationen. Dieser selbstfinanzierte Ansatz verbessert die Flexibilität und Entscheidungsgeschwindigkeit. Darüber hinaus zieht das Unternehmen Top -Talente an, wobei einige Forscher jährlich über 1,3 Millionen US -Dollar verdienen, hauptsächlich von chinesischen Universitäten.
Während Deepseeks anfängliche Schulungskostenansprüche in Höhe von 6 Millionen US-Dollar unrealistisch erscheint und sich nur für die Nutzung der GPU vor dem Training vorliegt und Forschung, Verfeinerung, Datenverarbeitung und Infrastruktur ausgeschlossen hat, hat das Unternehmen über 500 Millionen US-Dollar in die KI-Entwicklung investiert. Die kompakte Struktur erleichtert eine effiziente Implementierung der Innovation im Vergleich zu größeren, bürokratischeren Wettbewerbern.
Das Beispiel von Deepseek zeigt ein gut finanziertes unabhängiges KI-Unternehmen, das erfolgreich mit Branchenriesen konkurriert. Der Erfolg ist jedoch unbestreitbar mit erheblichen Investitionen, technischen Durchbrüchen und einem starken Team verbunden, wodurch der "revolutionäre Budget" die Behauptung etwas irreführend macht. Trotzdem bleiben die Kosten des Unternehmens deutlich niedriger als die Wettbewerber. Zum Beispiel gab Deepseek 5 Millionen US -Dollar für R1 aus, während Chatgpt4 100 Millionen US -Dollar kostete. Dieser Kostenunterschied unter Berücksichtigung der tatsächlichen Ausgaben von Deepseek zeigt einen erheblichen Wettbewerbsvorteil.
-
HochzeitsfrisurenEntdecken Sie Ihre Traum -Hochzeitsfrisur mit dem Foto -Editor der Hochzeitsfrisuren! Willkommen in der Welt der Hochzeitsfrisuren, wo Sie Ihre Brautfotos in atemberaubende Meisterwerke mit nur wenigen Wasserhähne verwandeln können. Unsere App ist ein vielseitiger Brautfoto -Editor, mit dem Sie eine Vielzahl von schönen hinzufügen können
-
Whack Whack WarMachen Sie sich bereit für ein aufregendes neues Abenteuer mit ** Whack Whack War **, ein Spiel, das nicht nur wild süchtig macht, sondern auch unglaublich einfach mit seinen entzückenden Grafiken und intuitiven One-Tap-Steuerelementen eintauchen kann. Treten Sie in die aufregende Arena, in der Sie den Befehl Ihres Helden übernehmen und sich auf eine Mission begeben werden
-
Army Bomb Games 3D Nuclear WarAtombombensimulator und Bomben entschärfen 3D: Bomb Explosion & Atombombenspielkrieg. Lassen Sie uns Bomben genießen, in dem Atombombenspiele 3D Offline -Multiplayer entschärfen und mit einer Bombenkader vorgestellt wurden. Laden Sie die Bombe herunter und entschärfen Sie das Spiel und seien Sie vorsichtig mit dem Angriff der Atombombe auf
-
One Lab - Artful Photo EditorEntfesselt Ihre Kreativität mit Onelab - Artful Photo Editor, einer revolutionären App, die eine Fülle von grafischen Möglichkeiten für Ihre Fingerspitzen bietet. Von der einfachen Fotobearbeitung bis hin zu umwerfendem Glitch-Kunst, Bildverzerrungen, prozeduraler Generation und 3D-Manipulation ist diese App ein Schatz für Artis
-
LEGO DUPLO WORLDLego Duplo World ist nicht nur ein reguläres Spiel. Es ist eine ansprechende und pädagogische Plattform, die speziell für Kinder entwickelt wurde. Mit einer riesigen Welt, die er mit farbenfrohen Tieren, Gebäuden, Fahrzeugen und Zügen aus Lego -Stücken erkunden kann, sind Kinder für ein interaktives und anregendes Erlebnis. T
-
Doppelgangers - find your twinEntfesseln Sie den Spaß, Ihr perfektes Aussehen mit unseren Doppelgängern zu finden - finden Sie Ihre Twin -App! Beginnen Sie Ihre Reise, indem Sie die App herunterladen und sich mühelos mit Ihrer bevorzugten Methode anmelden. Sobald Sie dabei sind, machen Sie ein klares Selfie und stellen Sie sicher, dass es nur um Sie geht - keine Ablenkungen benötigt. Unsere modernste EDG
-
Infinity Nikki: Neue Einlösungscodes für Jan. 2025 veröffentlicht!
-
GBA neu interpretiert: Gamer baut Mario 64 für Handheld neu
-
Dunkel und dunkleres Handy: Neue Inhalte und Lebensqualität Updates
-
Dracula beschwört unheiligen Terror in Storyngton Hall
-
Crocs mit Pokémon-Logo weisen beliebte Gen-1-Designs auf