Deepseek'in 1.6 milyar dolarlık geliştirme maliyeti

Deepseek'in yeni sohbet botu etkileyici bir tanıtımla övünüyor: "Merhaba, yaratıldım, böylece bir şey sorabilir ve sizi şaşırtabilecek bir cevap alabilirsiniz." Çin girişiminin bir ürünü olan bu AI, hızla büyük bir pazar rakibi haline geldi ve hatta Nvidia'nın hisse senedi fiyatında önemli bir düşüşe katkıda bulundu. Başarısı, çeşitli yenilikçi teknolojileri içeren eşsiz bir mimari ve eğitim metodolojisinden kaynaklanmaktadır.
Çoklu Tahmini Tahmin (MTP): Geleneksel kelime tahmininden farklı olarak, MTP aynı anda birden fazla kelimeyi tahmin ederek, daha fazla doğruluk ve verimlilik için farklı cümle parçalarını analiz eder.
Uzmanların Karışımı (MOE): Bu mimari, girdi verilerini işlemek, AI eğitimini hızlandırmak ve performansı iyileştirmek için birden fazla sinir ağından yararlanır. Deepseek V3, her bir jeton işleme görevi için sekiz'i etkinleştirerek 256 sinir ağı kullanır.
Çok Başlı Gizli Dikkat (MLA): Bu mekanizma, bilgi kaybını en aza indirmek ve ince nüansları yakalamak için metin parçalarından önemli ayrıntıları tekrar tekrar çıkararak önemli cümle parçalarına odaklanır.
Deepseek başlangıçta güçlü Deepseek V3 sinir ağını sadece 2048 GPU kullanarak sadece 6 milyon dolarlık eğittiğini iddia etti. Bununla birlikte, semianaliz çok daha önemli bir altyapı ortaya çıkarmıştır: 10.000 H800s, 10.000 H100s ve ek H20 GPU'lar dahil olmak üzere yaklaşık 50.000 NVIDIA Hopper GPU'ları birden fazla veri merkezine dağıtılmıştır. Bu, yaklaşık 1,6 milyar dolarlık bir sunucu yatırımına ve 944 milyon dolar olarak tahmin edilen operasyonel giderlere dönüşüyor.
Çin Hedge Fonu High-Flyer'in bir yan kuruluşu olan Deepseek, veri merkezlerinin sahibi, AI modeli optimizasyonu ve daha hızlı inovasyon uygulaması üzerinde tam kontrol sağlıyor. Bu kendi kendine finanse edilen yaklaşım esnekliği ve karar verme hızını artırır. Dahası, şirket en iyi yetenekleri çekiyor ve bazı araştırmacılar yılda 1.3 milyon doların üzerinde, öncelikle Çin üniversitelerinden kazanıyor.
Deepseek'in ilk 6 milyon dolarlık eğitim maliyet iddiası gerçekçi görünmese de-yalnızca GPU kullanımının öncesi eğitimine ve araştırma, arıtma, veri işleme ve altyapı hariç-şirket AI gelişimine 500 milyon doların üzerinde yatırım yaptı. Kompakt yapısı, daha büyük, daha bürokratik rakiplere kıyasla verimli inovasyon uygulamasını kolaylaştırır.
Deepseek'in örneği, endüstri devleriyle başarılı bir şekilde rekabet eden iyi finanse edilen bağımsız bir AI şirketini sergiliyor. Bununla birlikte, başarısı inkar edilemez bir şekilde önemli yatırımlar, teknik atılımlar ve güçlü bir ekiple bağlantılıdır, bu da "devrimci bütçenin" biraz yanıltıcı iddia etmesini sağlar. Bununla birlikte, şirketin maliyetleri rakiplerden önemli ölçüde daha düşüktür; Örneğin, Deepseek R1'e 5 milyon dolar harcarken, ChatGpt4 100 milyon dolara mal oldu. Bu maliyet farkı, Deepseek'in gerçek harcamaları göz önüne alındığında bile, önemli bir rekabet avantajını vurgulamaktadır.
-
Wedding Hairstyles on photoDüğün Saç Modelleri Fotoğraf Editörü ile Hayalinizdeki Düğün Saç Modelini Keşfedin! Gelin fotoğraflarınızı sadece birkaç muslukla çarpıcı başyapıtlara dönüştürebileceğiniz düğün saç stilleri dünyasına hoş geldiniz. Uygulamamız, çeşitli güzelleri eklemenizi sağlayan çok yönlü bir gelin fotoğraf editörüdür
-
Whack Whack WarSadece çılgınca bağımlılık yapmakla kalmayıp aynı zamanda sevimli grafikleri ve sezgisel tek dokunuşla dalış yapmak için inanılmaz derecede kolay olan bir oyun olan ** Whack War ** ile canlandırıcı yeni bir maceraya hazır olun. Kahramanınızın komutasını alacağınız ve bir göreve başlayacağınız heyecan verici arenaya adım atın
-
Army Bomb Games 3D Nuclear WarNükleer Bomba Simülatörü ve Bomba Defuse 3D: Bomba Patlaması ve Nükleer Bomba Oyunları Savaşı. İnanılmaz bir nuke bomba oyunlarında bomba disuse ekibiyle tanıtılan 3D çevrimdışı çok oyunculu nükleer bomba oyunlarını bozan bomba keyfini çıkaralım. Bomba Defuse oyununu indirin ve atom bombasının saldırısına dikkat edin
-
One Lab - Artful Photo EditorOnelab - Artful Photo Editor ile yaratıcılığınızı serbest bırakın, parmaklarınızın ucunda zengin bir grafik olasılık sunan devrimci bir uygulama. Basit fotoğraf düzenlemeden akıl bedelini büken aksaklık sanatına, görüntü bozulmalarına, prosedürel üretime ve 3D manipülasyona kadar, bu uygulama Artis için bir hazine trove
-
LEGO DUPLO WORLDLego Duplo World sadece normal bir oyun değil; Özellikle çocuklar için tasarlanmış ilgi çekici ve eğitim platformudur. LEGO parçalarından yapılmış renkli hayvanlar, binalar, araçlar ve trenlerle dolu geniş bir dünyayla, çocuklar etkileşimli ve uyarıcı bir deneyim içindedir. T
-
Doppelgangers - find your twinDoppelganger'larımızla mükemmel bir benzeri bulmanın eğlencesini serbest bırakın - İkiz Uygulamanızı Bulun! Uygulamayı indirerek ve tercih ettiğiniz yöntemle zahmetsizce imzalayarak yolculuğunuza başlayın. İçeri girdikten sonra, her şeyin sizinle ilgili olduğundan emin olarak açık bir selfie çekin - dikkat dağıtıcı unsurlara gerek yok. Kesme EDG'miz
-
Infinity Nikki: Ocak 2025 için Yeni Kurtarma Kodları Çıktı!
-
GBA Yeniden Tasarlandı: Oyuncu Mario 64'ü Taşınabilir Cihazlar için Yeniden Oluşturuyor
-
Karanlık ve Koyu Mobil: Yeni İçerik ve Yaşam Kalitesi Güncellemeleri
-
Drakula, Storyngton Salonu'nda Kutsal Olmayan Terörü Çağırıyor
-
Pokémon Markalı Crocs Popüler 1. Nesil Tasarımlara Sahiptir