DeepSeek的$ 1.6B开发成本揭穿了
DeepSeek的新聊天机器人拥有令人印象深刻的介绍:“嗨,我被创建了,您可以问任何东西,并得到一个甚至可能让您感到惊讶的答案。”这种AI是中国初创公司DeepSeek的产物,已迅速成为主要的市场竞争对手,甚至导致NVIDIA的股价大幅下降。它的成功源于一种独特的建筑和培训方法,结合了几种创新技术。
多语预测(MTP):与传统的单词预测不同,MTP同时预测多个单词,分析不同的句子以提高准确性和效率。
专家(MOE)的混合:该体系结构利用多个神经网络处理输入数据,加速AI培训并提高性能。 DeepSeek V3使用256个神经网络,为每个令牌处理任务激活8个。
多头潜在注意力(MLA):这种机制着重于关键的句子部分,从文本片段中反复提取关键细节,以最大程度地减少信息丢失并捕获细微的细微差别。
DeepSeek最初声称已经培训了其强大的DeepSeek V3神经网络,仅使用2048 GPU,仅使用600万美元。但是,半分析显示出更大的基础设施:大约50,000个NVIDIA HOPPER GPU,包括10,000 H800,10,000 H100和其他H20 GPU,分布在多个数据中心。这意味着服务器投资约为16亿美元,运营费用估计为9.44亿美元。
DeepSeek是中国对冲基金高级飞行者的子公司拥有其数据中心,授予AI模型优化和更快的创新实施的完全控制。这种自资助的方法提高了灵活性和决策速度。此外,该公司吸引了顶尖人才,一些研究人员每年收入超过130万美元,主要来自中国大学。
虽然DeepSeek最初的600万美元培训成本索赔似乎是不现实的,但仅引用了培训的GPU使用情况,并排除了研究,改进,数据处理和基础设施,但该公司已在AI开发方面投资了超过5亿美元。与更大的官僚竞争者相比,其紧凑的结构有助于有效的创新实施。
DeepSeek的示例展示了一家资金充足的独立AI公司,成功与行业巨头竞争。但是,它的成功无疑与大量投资,技术突破和强大的团队有关,这使“革命预算”声称有些误导。然而,公司的成本仍然明显低于竞争对手;例如,DeepSeek在R1上花费了500万美元,而Chatgpt4的费用为1亿美元。即使考虑到DeepSeek的实际支出,这种成本差异也强调了竞争优势。




-
LABer通过策略性地构建你的故事来实现销售 通过策略性地构建你的故事来实现销售 — 专为数字艺术家打造的创意工作室,隶属于 Arrival QUALITY inc。尽情享受应用程序,并探索前所未有的全新、创新体验。 -
هوزه体验终极hajwal游戏,内置丰富功能,团队制玩法,高品质载具,以及极其逼真的地图。 Hose Hajwalah在线游戏完全免费,提供诸多福利,并持续获得精彩更新。 享受专属功能、独特汽车和特别地图。立即试玩。 -
WonderBox组织史诗级的NPC战斗,与物体互动,完成跑酷挑战,以及更多内容。 随心所欲:策划大规模的NPC冲突,建造塔防,与环境物体互动,掌握跑酷课程,还有更多玩法。你的想象力是唯一的限制。 -
The Crawler: Unleashed释放一只可怕的掠食者,吞噬一切,然后逃脱——《爬行者:觉醒》。 在《爬行者:觉醒》中,你将操控一只在顶级机密实验室中诞生的恐怖生物工程掠食者。这头生物是某次灾难性实验的产物,体内只有一种原始本能:吞噬并进化。你的旅程将带你穿越昏暗、错综复杂的设施,那里遍布惊恐的科学家、全副武装的守卫以及致命的安保系统。 吞噬你路径上的一切以获得力量,并解锁毁灭性的新能力。随着你不断推进,打破实验室的束缚,踏入毫无防备的外部世界,一路制造彻底的破坏。面对人类日益激烈的反抗,但凭借你永不满足的饥饿感与持续增强的力量 -
Orange* Design for Happy Life开始使用 Orange* 官方应用Orange* 官方应用现已上线实时获取最新资讯、专属优惠和新闻主要功能○ 实时更新即时接收优惠和优惠券!○ 数字会员卡将应用用作您的会员卡!○ 造型目录随时浏览最新发型!前往沙龙前查看,做好更充分准备!更多精彩功能即将上线! -
hapty jackpot想找一款随时随地都能畅玩的刺激老虎机游戏?你的等待结束了,快来体验 Hapty Jackpot!这款应用将赌场级别的刺激与高风险的精彩玩法融为一体,让你仿佛化身真正的尊贵贵宾。游戏采用流畅的视觉设计与丰富多样的游戏选择,带来奢华且沉浸式的体验,让你连续数小时沉浸其中,乐此不疲。准备赢取大奖了吗?立即下载 Hapty Jackpot,开启通往惊人奖励的旋转之旅! Hapty Jackpot 的主要特色: 多样化的老虎机主题:畅享丰富多样的老虎机主题——从经典水果机到奇幻冒险,应有尽有。丰富的选择确