Hogar > Noticias > El costo de desarrollo de $ 1.6b de Deepseek desacreditado

El costo de desarrollo de $ 1.6b de Deepseek desacreditado

Mar 13,25(Hace 1 meses)
El costo de desarrollo de $ 1.6b de Deepseek desacreditado

El nuevo chatbot de Deepseek cuenta con una introducción impresionante: "Hola, fui creado para que puedas preguntar cualquier cosa y obtener una respuesta que incluso te sorprenda". Esta IA, un producto de la startup china Deepseek, se ha convertido rápidamente en un importante competidor del mercado, incluso contribuyendo a una caída significativa en el precio de las acciones de Nvidia. Su éxito proviene de una metodología única de arquitectura y capacitación que incorpora varias tecnologías innovadoras.

Predicción de múltiples token (MTP): a diferencia de la predicción tradicional de palabras por palabra, MTP pronostica múltiples palabras simultáneamente, analizando diferentes piezas de oraciones para una mayor precisión y eficiencia.

Mezcla de expertos (MOE): esta arquitectura aprovecha múltiples redes neuronales para procesar datos de entrada, acelerar la capacitación de IA y mejorar el rendimiento. Deepseek V3 utiliza 256 redes neuronales, activando ocho para cada tarea de procesamiento de tokens.

Atención latente de múltiples cabezas (MLA): este mecanismo se centra en piezas de oración cruciales, extrayendo repetidamente detalles clave de fragmentos de texto para minimizar la pérdida de información y capturar matices sutiles.

Inicialmente, Deepseek afirmó haber entrenado su poderosa red neuronal Deepseek V3 por solo $ 6 millones utilizando solo 2048 GPU. Sin embargo, el semianálisis reveló una infraestructura mucho más sustancial: aproximadamente 50,000 GPU de tolva NVIDIA, incluidas 10,000 H800, 10,000 H100 y GPU H20 adicionales, distribuidas en múltiples centros de datos. Esto se traduce en una inversión de servidor de aproximadamente $ 1.6 mil millones y los gastos operativos estimados en $ 944 millones.

Deepseek, una subsidiaria del Fondo de cobertura chino High-Flyer, posee sus centros de datos, que otorga un control completo sobre la optimización del modelo de IA y la implementación de innovación más rápida. Este enfoque autofinanciado mejora la flexibilidad y la velocidad de toma de decisiones. Además, la compañía atrae a los mejores talentos, con algunos investigadores ganando más de $ 1.3 millones anuales, principalmente de universidades chinas.

Si bien el reclamo inicial de costos de capacitación de $ 6 millones de Deepseek parece poco realista, solo se refiere al uso previo al uso de GPU y excluyendo la investigación, el refinamiento, el procesamiento de datos e infraestructura, la compañía ha invertido más de $ 500 millones en desarrollo de IA. Su estructura compacta facilita la implementación de innovación eficiente en comparación con competidores más grandes y burocráticos.

El ejemplo de Deepseek muestra una compañía de IA independiente bien financiada que compite con éxito con los gigantes de la industria. Sin embargo, su éxito está indudablemente vinculado a inversiones sustanciales, avances técnicos y un equipo fuerte, lo que hace que el "presupuesto revolucionario" reclame algo engañoso. Sin embargo, los costos de la compañía siguen siendo significativamente más bajos que los competidores; Por ejemplo, Deepseek gastó $ 5 millones en R1, mientras que ChatGPT4 costó $ 100 millones. Esta diferencia de costos, incluso considerando el gasto real de Deepseek, destaca una ventaja competitiva significativa.

Prueba de SpeeekDeepseek v3VeteranoVeterano

Descubrir
  • Peinados de boda
    Peinados de boda
    ¡Descubre el peinado de la boda de tus sueños con el editor de fotos de Wedding Hairstyles! Bienvenido al mundo de los peinados de la boda, donde puedes transformar tus fotos nupciales en impresionantes obras maestras con solo unos pocos grifos. Nuestra aplicación es un editor de fotos nupcial versátil que le permite agregar una variedad de hermosas
  • Whack Whack War
    Whack Whack War
    Prepárese para una nueva aventura estimulante con ** Whack Whack War **, un juego que no solo es tremendamente adictivo, sino que también es increíblemente fácil de sumergirse con sus adorables gráficos y sus controles intuitivos de un toque. Entra en la emocionante arena, donde tomarás el mando de tu héroe y te embarcarás en una misión
  • Army Bomb Games 3D Nuclear War
    Army Bomb Games 3D Nuclear War
    Simulador de bombas nuclear y desactivación de bombas 3D: Guerra de Juegos de Bombas de Bombas y Bombas Nuclear. Disfrutemos de los Juegos de Bombas Nucleares Nuclear Bombes multijugador 3D fuera de línea, introducido con un equipo de desactivación de bombas en un increíble juego de bombas nucleares. Descargue el juego de desacuerdo con la bomba y tenga cuidado con el ataque de la bomba atómica a
  • One Lab - Artful Photo Editor
    One Lab - Artful Photo Editor
    Desata su creatividad con OneLab - Artful Photo Editor, una aplicación revolucionaria que ofrece una gran cantidad de posibilidades gráficas a su alcance. Desde una simple edición de fotos hasta arte de falla alucinante, distorsiones de imágenes, generación de procedimientos y manipulación 3D, esta aplicación es un tesoro para Artis
  • LEGO DUPLO WORLD
    LEGO DUPLO WORLD
    Lego Duplo World no es solo un juego regular; Es una plataforma atractiva y educativa diseñada específicamente para niños. Con un vasto mundo para explorar llenos de animales coloridos, edificios, vehículos y trenes hechos de piezas de LEGO, los niños tienen una experiencia interactiva y estimulante. T
  • Doppelgangers - find your twin
    Doppelgangers - find your twin
    Desata la diversión de encontrar su aspecto perfecto con nuestros doppelgangers: ¡encuentre su aplicación gemela! Comience su viaje descargando la aplicación y firmando sin esfuerzo con su método preferido. Una vez que esté dentro, tome una selfie clara, asegurándose de que se trata de usted, no se necesitan distracciones. Nuestro Cutting Edg