Dom > Aktualności > Koszt rozwoju Deepseek 1,6 mld USD obalał
Koszt rozwoju Deepseek 1,6 mld USD obalał

Nowy chatbot Deepseek ma imponujące wprowadzenie: „Cześć, zostałem stworzony, abyś mógł zapytać wszystko i uzyskać odpowiedź, która może cię nawet zaskoczyć”. Ta sztuczna inteligencja, produkt chińskiego startupu Deepseek, szybko stał się głównym konkurentem rynku, nawet przyczyniając się do znacznego spadku ceny akcji NVIDIA. Jego sukces wynika z unikalnej metodologii architektury i szkoleń obejmującej kilka innowacyjnych technologii.
Prognozowanie wielu tokenów (MTP): W przeciwieństwie do tradycyjnej prognozy słowa, MTP prognozuje wiele słów jednocześnie, analizując różne części zdań w celu zwiększenia dokładności i wydajności.
Mieszanka ekspertów (MOE): Architektura ta wykorzystuje wiele sieci neuronowych do przetwarzania danych wejściowych, przyspieszając szkolenie AI i poprawę wydajności. Deepseek V3 wykorzystuje 256 sieci neuronowych, aktywując osiem dla każdego zadania przetwarzania tokenu.
Wielowłótnie utajone uwaga (MLA): Mechanizm ten koncentruje się na kluczowych częściach zdań, wielokrotnie wydobywając kluczowe szczegóły z fragmentów tekstu w celu zminimalizowania utraty informacji i przechwytywania subtelnych niuansów.
Deepseek początkowo twierdził, że wyszkolił swoją potężną sieć neuronową Deepseek V3 za zaledwie 6 milionów dolarów za pomocą zaledwie 2048 GPU. Jednak semianaliza ujawniła o wiele bardziej znaczącą infrastrukturę: około 50 000 GPU Nvidia Hopper, w tym 10 000 H800s, 10 000 H100 i dodatkowe GPU H20, rozmieszczone w wielu centrach danych. Przekłada się to na inwestycję serwerową w wysokości około 1,6 miliarda USD, a wydatki operacyjne szacowane na 944 mln USD.
Deepseek, spółka zależna chińskiego funduszu hedgingowego High-Flyer, jest właścicielem swoich centrów danych, zapewniając pełną kontrolę nad optymalizacją modelu AI i szybszą wdrażanie innowacji. To samofinansowane podejście zwiększa elastyczność i szybkość podejmowania decyzji. Ponadto firma przyciąga najlepsze talenty, a niektórzy badacze zarabiają ponad 1,3 miliona dolarów rocznie, głównie z chińskich uniwersytetów.
Podczas gdy początkowe roszczenie dotyczące kosztów szkoleń DeEPSEEEK w wysokości 6 milionów dolarów wydaje się nierealistyczne-odnosząc się jedynie do korzystania z GPU przed treningiem i wykluczeniem badań, udoskonalania, przetwarzania danych i infrastruktury-firma zainwestowała ponad 500 milionów dolarów w rozwój AI. Jego kompaktowa struktura ułatwia wydajne wdrożenie innowacji w porównaniu z większymi, bardziej biurokratycznymi konkurentami.
Przykład Deepseek pokazuje dobrze finansowaną niezależną firmę AI z powodzeniem konkurującym z gigantami branżowymi. Jednak jego sukces jest niezaprzeczalnie powiązany ze znacznymi inwestycjami, przełomami technicznymi i silnym zespołem, co sprawia, że „rewolucyjny budżet” roszczył nieco mylące. Niemniej jednak koszty firmy pozostają znacznie niższe niż konkurenci; Na przykład Deepseek wydał 5 milionów dolarów na R1, podczas gdy Chatgpt4 kosztował 100 milionów dolarów. Ta różnica kosztów, nawet biorąc pod uwagę faktyczne wydatki Deepseek, podkreśla znaczącą przewagę konkurencyjną.
-
Wedding Hairstyles on photoOdkryj swoją wymarzoną fryzurę ślubną z edytorem zdjęć fryzur ślubnych! Witamy w świecie fryzur ślubnych, gdzie możesz przekształcić swoje zdjęcia ślubne w oszałamiające arcydzieła z kilkoma kranami. Nasza aplikacja to wszechstronny edytor zdjęć ślubnych, który pozwala dodać różnorodne piękne
-
Whack Whack WarPrzygotuj się na radosną nową przygodę z ** Whack Whack War **, grę, która jest nie tylko szalenie uzależniająca, ale także niezwykle łatwa do zanurzenia dzięki uroczej grafice i intuicyjnej kontroli jednego z jednym kątem. Wejdź na ekscytującą arenę, gdzie weźmiesz dowódca swojego bohatera i wyruszaj w misję
-
Army Bomb Games 3D Nuclear WarSymulator bomby nuklearnej i BOMBUSE LESE 3D: Bomb Blast & Nuclear Bomb Games War. Cieszmy się bombą, która rozróżnia grę bomby nuklearnej 3D Offline Multiplayer, wprowadzony ze składem rozładowywania bomby w niesamowitych grach bombowych. Pobierz grę rozładowywania bomby i uważaj na atak bomby atomowej
-
One Lab - Artful Photo EditorUwolnij swoją kreatywność z Onelab - Artful Photo Editor, rewolucyjną aplikacją, która oferuje bogactwo możliwości graficznych na wyciągnięcie ręki. Od prostej edycji zdjęć po odgrywającą się sztukę, zniekształcenia obrazu, generowanie procedurów i manipulacje 3D, ta aplikacja jest skarbnicą dla Artis
-
LEGO DUPLO WORLDLego Deplo World to nie tylko zwykła gra; Jest to angażująca i edukacyjna platforma zaprojektowana specjalnie dla dzieci. Z rozległym światem do zwiedzania kolorowych zwierząt, budynków, pojazdów i pociągów wykonanych z elementów Lego, dzieci mają interaktywne i stymulujące doświadczenie. T
-
Doppelgangers - find your twinUwolnij zabawę z znalezienia idealnego wyglądu z naszymi Doppelgangers - Znajdź swoją aplikację podwójną! Rozpocznij swoją podróż od pobrania aplikacji i bez wysiłku podpisaniem preferowanej metody. Po wejściu, złap wyraźne selfie, upewniając się, że wszystko o tobie - nie potrzebne rozproszenie. Nasz cutter-edg
-
Infinity Nikki: Nowe kody odnoszącego się na styczeń 2025 wydane!
-
GBA Reimagined: Gracz przebudowuje Mario 64 na urządzenia przenośne
-
Mroczny i ciemniejszy telefon komórkowy: nowe aktualizacje treści i jakości życia
-
Dracula wywołuje bezbożny terror w Storyngton Hall
-
Crocsy marki Pokémon mają popularne projekty pierwszej generacji