DeepSeek的$ 1.6B开发成本揭穿了
DeepSeek的新聊天机器人拥有令人印象深刻的介绍:“嗨,我被创建了,您可以问任何东西,并得到一个甚至可能让您感到惊讶的答案。”这种AI是中国初创公司DeepSeek的产物,已迅速成为主要的市场竞争对手,甚至导致NVIDIA的股价大幅下降。它的成功源于一种独特的建筑和培训方法,结合了几种创新技术。
多语预测(MTP):与传统的单词预测不同,MTP同时预测多个单词,分析不同的句子以提高准确性和效率。
专家(MOE)的混合:该体系结构利用多个神经网络处理输入数据,加速AI培训并提高性能。 DeepSeek V3使用256个神经网络,为每个令牌处理任务激活8个。
多头潜在注意力(MLA):这种机制着重于关键的句子部分,从文本片段中反复提取关键细节,以最大程度地减少信息丢失并捕获细微的细微差别。
DeepSeek最初声称已经培训了其强大的DeepSeek V3神经网络,仅使用2048 GPU,仅使用600万美元。但是,半分析显示出更大的基础设施:大约50,000个NVIDIA HOPPER GPU,包括10,000 H800,10,000 H100和其他H20 GPU,分布在多个数据中心。这意味着服务器投资约为16亿美元,运营费用估计为9.44亿美元。
DeepSeek是中国对冲基金高级飞行者的子公司拥有其数据中心,授予AI模型优化和更快的创新实施的完全控制。这种自资助的方法提高了灵活性和决策速度。此外,该公司吸引了顶尖人才,一些研究人员每年收入超过130万美元,主要来自中国大学。
虽然DeepSeek最初的600万美元培训成本索赔似乎是不现实的,但仅引用了培训的GPU使用情况,并排除了研究,改进,数据处理和基础设施,但该公司已在AI开发方面投资了超过5亿美元。与更大的官僚竞争者相比,其紧凑的结构有助于有效的创新实施。
DeepSeek的示例展示了一家资金充足的独立AI公司,成功与行业巨头竞争。但是,它的成功无疑与大量投资,技术突破和强大的团队有关,这使“革命预算”声称有些误导。然而,公司的成本仍然明显低于竞争对手;例如,DeepSeek在R1上花费了500万美元,而Chatgpt4的费用为1亿美元。即使考虑到DeepSeek的实际支出,这种成本差异也强调了竞争优势。




-
化妆小公主为公主设计造型并精心装扮!关于宝宝巴士宝宝巴士始终致力于激发孩子的创造力、想象力和好奇心。我们从儿童视角出发设计产品,帮助他们独立探索世界。目前宝宝巴士为全球0-8岁的4亿多小粉丝提供多样化的产品、视频及教育内容!我们的教育产品包含: 200余款儿童教育应用 2500多集童谣动画 内容涵盖健康、语言、社会、科学、艺术等领域 联系我们邮箱:[email protected] 官网:http://www.babybus.com版本8.71.13.01更新内容更新日期:2024年11月7日 本次更新包含问 -
Vehicle Inspection Maintenance车辆检查维护应用程序提供了一套完整的解决方案,可简化车辆检查、维护工单、燃油追踪及安全合规流程。该应用具备可定制的数字表单、无纸化记录保存和自动提醒功能,能有效优化车队运营。从日常车辆检查到零部件库存管理及维修协调,它在保持合规性的同时实现了高效运作。诸如采购申请、燃油监控和事件记录等附加功能,更有助于提升生产力、完善安全规程并降低运营成本。 车辆检查维护的主要功能: 全面车队管理:我们的综合解决方案可处理包括检查、维护工作流和燃油追踪在内的所有车队需求。在轻松满足行业合规要求的同时简 -
Zello PTT Walkie Talkie使用这款免费的 PTT 无线电应用程序,将您的设备变成功能强大的对讲机!Zello PTT Walkie Talkie 可让您通过高质量语音传输与联系人实时交流,还可加入公共频道进行热烈讨论。这款应用程序具有文本状态、呼叫提醒和实时位置跟踪等功能,是移动中保持联系的完美选择。无论您使用的是 WiFi 还是移动数据,这款应用程序都能确保您与朋友、家人或同事进行可靠的通信。现在就下载该应用程序,体验指尖上即时语音通信的便利和乐趣。Zello PTT Walkie Talkie 的功能:> 高品质语 -
Learn British English. Speak B通过Speak B应用程序学习英式英语。这个创新平台提供多语言讲解的互动视频课程,旨在为全球学习者提供便捷且引人入胜的学习体验。其特色包括海量教学内容、根据您的兴趣或职业定制的个性化课程,以及采用科学验证的间隔重复方法以加速学习进程并提升长期记忆效果。无论您的目标是提升日常对话能力、掌握动词变位、应对复杂讨论,还是为现实场景做准备,Learn British English都能提供所需资源。此外,通过内置测验、进度追踪和免手持学习功能,本应用为您提供实用而高效的语言流利度提升方案。 Lea -
Open Sudoku厌倦了满是干扰广告的数独游戏吗?您的寻找到此为止。Open Sudoku 是满足您所有数独需求的终极解决方案。这款基于 Roman Mašek 原始代码开发的开源应用,提供多种数字输入方式,支持访问可下载谜题,并能使用 GNOME Sudoku 引擎生成新谜题。它包含时间追踪、导出功能以及可自定义主题,为您带来极致的数独体验。告别广告,迎接无限数独乐趣。我们欢迎您通过 http://opensudoku.moire.org 提交反馈与建议。Open Sudoku 的功能特色:无广告体验:畅享游戏 -
Boken Sky通过Boken Sky应用程序体验完全自由,您的选择将塑造每一次冒险。这款视觉小说融合了兽人与人类角色,提供多样化的幻想供您探索,同时让您全程掌控一切。您可策略性地应对各种情景,并随时通过调整内容偏好来自定义体验。沉浸在这个每个抉择都至关重要的幻想领域中——立即下载,开启您的个性化旅程! Boken Sky主要特色:庞大角色阵容:独具匠心的拟人化角色与人类角色混合搭配,满足不同偏好。真实选择机制:您的决策会直接影响故事走向,并可按需筛选内容。沉浸式叙事体验:通过轻度RPG元素增强的丰富叙事让人