DeepSeek's $1.6B Development Cost Debunked

ডিপসেকের নতুন চ্যাটবট একটি চিত্তাকর্ষক ভূমিকা নিয়ে গর্বিত: "হাই, আমি তৈরি হয়েছিল যাতে আপনি কিছু জিজ্ঞাসা করতে পারেন এবং এমন একটি উত্তর পেতে পারেন যা আপনাকে অবাক করে দিতে পারে।" This AI, a product of the Chinese startup DeepSeek, has rapidly become a major market competitor, even contributing to a significant drop in NVIDIA's stock price. Its success stems from a unique architecture and training methodology incorporating several innovative technologies.
Multi-token Prediction (MTP): Unlike traditional word-by-word prediction, MTP forecasts multiple words simultaneously, analyzing different sentence parts for enhanced accuracy and efficiency.
Mixture of Experts (MoE): This architecture leverages multiple neural networks to process input data, accelerating AI training and improving performance. DeepSeek V3 utilizes 256 neural networks, activating eight for each token processing task.
Multi-head Latent Attention (MLA): This mechanism focuses on crucial sentence parts, repeatedly extracting key details from text fragments to minimize information loss and capture subtle nuances.
DeepSeek initially claimed to have trained its powerful DeepSeek V3 neural network for a mere $6 million using only 2048 GPUs. However, SemiAnalysis revealed a far more substantial infrastructure: approximately 50,000 Nvidia Hopper GPUs, including 10,000 H800s, 10,000 H100s, and additional H20 GPUs, distributed across multiple data centers. This translates to a server investment of roughly $1.6 billion and operational expenses estimated at $944 million.
DeepSeek, a subsidiary of the Chinese hedge fund High-Flyer, owns its data centers, granting complete control over AI model optimization and faster innovation implementation. এই স্ব-অর্থায়িত পদ্ধতির নমনীয়তা এবং সিদ্ধান্ত গ্রহণের গতি বাড়ায়। তদুপরি, সংস্থাটি শীর্ষ প্রতিভা আকর্ষণ করে, কিছু গবেষক মূলত চীনা বিশ্ববিদ্যালয় থেকে বার্ষিক ১.৩ মিলিয়ন ডলারের বেশি আয় করেন।
While DeepSeek's initial $6 million training cost claim appears unrealistic—referring only to pre-training GPU usage and excluding research, refinement, data processing, and infrastructure—the company has invested over $500 million in AI development. Its compact structure facilitates efficient innovation implementation compared to larger, more bureaucratic competitors.
DeepSeek's example showcases a well-funded independent AI company successfully competing with industry giants. However, its success is undeniably linked to substantial investments, technical breakthroughs, and a strong team, making the "revolutionary budget" claim somewhat misleading. Nevertheless, the company's costs remain significantly lower than competitors; for example, DeepSeek spent $5 million on R1, while ChatGPT4 cost $100 million. This cost difference, even considering DeepSeek's actual expenditure, highlights a significant competitive advantage.
-
Wedding Hairstyles on photoআপনার স্বপ্নের বিবাহের হেয়ারস্টাইলটি বিবাহের চুলের স্টাইলগুলি ফটো সম্পাদক সহ আবিষ্কার করুন! ওয়েডিং হেয়ারস্টাইলগুলির জগতে আপনাকে স্বাগতম, যেখানে আপনি আপনার বিবাহের ফটোগুলি কেবল কয়েকটি ট্যাপ দিয়ে অত্যাশ্চর্য মাস্টারপিসে রূপান্তর করতে পারেন। আমাদের অ্যাপ্লিকেশনটি একটি বহুমুখী দাম্পত্য ফটো সম্পাদক যা আপনাকে বিভিন্ন ধরণের সুন্দর যুক্ত করতে দেয়
-
Whack Whack War** হ্যাক হ্যাক ওয়ার ** দিয়ে একটি আনন্দদায়ক নতুন অ্যাডভেঞ্চারের জন্য প্রস্তুত হন, এমন একটি খেলা যা কেবল বন্যভাবে আসক্তি নয়, তবে এর আরাধ্য গ্রাফিক্স এবং স্বজ্ঞাত এক-ট্যাপ নিয়ন্ত্রণগুলির সাথে ডুব দেওয়া অবিশ্বাস্যভাবে সহজ। রোমাঞ্চকর অঙ্গনে প্রবেশ করুন, যেখানে আপনি আপনার নায়কের কমান্ড নেবেন এবং একটি মিশনে যাত্রা শুরু করবেন
-
Army Bomb Games 3D Nuclear Warপারমাণবিক বোমা সিমুলেটর এবং বোমা 3 ডি ডিফিউস: বোমা বিস্ফোরণ এবং পারমাণবিক বোমা গেমস যুদ্ধ। আসুন বোমা ডিফিউজিং পারমাণবিক বোমা গেমস 3 ডি অফলাইন মাল্টিপ্লেয়ার উপভোগ করি, একটি আশ্চর্যজনক নুক বোমা গেমসে বোমা ডিউজ স্কোয়াডের সাথে পরিচয় হয়। বোমা ডিউজ গেমটি ডাউনলোড করুন এবং পারমাণবিক বোমার আক্রমণ সম্পর্কে সতর্ক থাকুন
-
One Lab - Artful Photo Editorওয়েলাবের সাথে আপনার সৃজনশীলতা প্রকাশ করুন - আর্টফুল ফটো এডিটর, একটি বিপ্লবী অ্যাপ্লিকেশন যা আপনার নখদর্পণে গ্রাফিক সম্ভাবনার প্রচুর পরিমাণে সরবরাহ করে। সাধারণ ফটো সম্পাদনা থেকে মন-বাঁকানো গ্লিচ আর্ট, চিত্রের বিকৃতি, পদ্ধতিগত প্রজন্ম এবং 3 ডি ম্যানিপুলেশন পর্যন্ত এই অ্যাপ্লিকেশনটি আর্টিসের জন্য একটি ধনকোষ
-
LEGO DUPLO WORLDলেগো ডুপলো ওয়ার্ল্ড কেবল একটি নিয়মিত খেলা নয়; এটি বিশেষত বাচ্চাদের জন্য ডিজাইন করা একটি আকর্ষক এবং শিক্ষামূলক প্ল্যাটফর্ম। রঙিন প্রাণী, বিল্ডিং, যানবাহন এবং লেগো টুকরা দিয়ে তৈরি ট্রেনগুলি দিয়ে ভরাট অন্বেষণ করার জন্য একটি বিশাল বিশ্বের সাথে বাচ্চারা একটি ইন্টারেক্টিভ এবং উদ্দীপক অভিজ্ঞতার জন্য রয়েছে। টি
-
Doppelgangers - find your twinআমাদের ডপেলগানগারদের সাথে আপনার নিখুঁত লুকালাইক সন্ধান করার মজাটি প্রকাশ করুন - আপনার টুইন অ্যাপটি সন্ধান করুন! অ্যাপ্লিকেশনটি ডাউনলোড করে এবং আপনার পছন্দসই পদ্ধতিতে অনায়াসে সাইন ইন করে আপনার যাত্রা শুরু করুন। একবার আপনি প্রবেশ করার পরে, একটি পরিষ্কার সেলফি স্ন্যাপ করুন, এটি নিশ্চিত করে যে এটি আপনার সম্পর্কে সমস্ত কিছু - কোনও বিভ্রান্তির প্রয়োজন নেই। আমাদের কাটিয়া-সম্পাদনা
-
ইনফিনিটি নিক্কি: 2025 জানুয়ারীর জন্য নতুন রিডিম কোডগুলি প্রকাশিত!
-
GBA পুনর্নির্মাণ: গেমার হ্যান্ডহেল্ডের জন্য মারিও 64 পুনর্নির্মাণ করেছে
-
গা dark ় এবং গা dark ় মোবাইল: নতুন সামগ্রী এবং জীবন-জীবনযাত্রার আপডেটগুলি
-
ড্রাকুলা স্টোরিংটন হলে অপবিত্র সন্ত্রাস জারি করে
-
Pokémon-Branded Crocs বৈশিষ্ট্য জনপ্রিয় Gen 1 ডিজাইন