DeepSeek retrasa R2 y opta por NVIDIA tras tropiezos con Huawei

  • DeepSeek aparca el entrenamiento con Huawei Ascend por fallos y falta de un ecosistema maduro.
  • R2, previsto para mayo, sufre demora y el entrenamiento migra a NVIDIA H20.
  • Se plantea usar Ascend para la inferencia mientras se mantiene CUDA para desarrollar y optimizar.
  • Tensión en China entre autonomía tecnológica y rendimiento inmediato de los chips extranjeros.

Imagen ilustrativa sobre DeepSeek y hardware de IA

La empresa china de inteligencia artificial DeepSeek ha dado un giro en su estrategia de hardware: tras varios intentos, el entrenamiento de su modelo R2 no ha prosperado con los chips Ascend de Huawei y la compañía ha optado por volver al ecosistema de NVIDIA. La decisión llega después de topar con problemas técnicos persistentes que han impedido cumplir el calendario inicialmente marcado.

El cambio de rumbo no se produce en el vacío. En el contexto de restricciones de exportación de Estados Unidos y de la apuesta de Pekín por la autosuficiencia en semiconductores, DeepSeek fue una de las firmas que apostó por una infraestructura local. Sin embargo, la realidad del rendimiento y del software ha pesado más que las intenciones políticas, forzando un aplazamiento del lanzamiento de R2.

Del impulso doméstico al giro pragmático

Tecnología de IA en entornos de alto rendimiento

Durante meses, DeepSeek trató de entrenar su nuevo modelo con la línea Ascend de Huawei, incluida la 910C, en paralelo a la presión gubernamental para reducir la dependencia de proveedores extranjeros. La apuesta, sin embargo, se encontró con inestabilidad del sistema, menor velocidad de interconexión entre chips y la ausencia de un equivalente funcional a CUDA, la plataforma que vertebra el desarrollo en GPU de NVIDIA.

Para intentar reconducir la situación, Huawei desplazó ingenieros a las instalaciones de DeepSeek con el objetivo de optimizar el entorno Ascend. A pesar de la colaboración, las pruebas de entrenamiento no alcanzaron el rendimiento necesario para un modelo de esta envergadura, algo que diversas fuentes atribuyen a la madurez del software y a la complejidad del escalado en clústeres grandes.

Fuentes citadas por medios como el Financial Times sostienen que el cuello de botella no fue un único componente, sino la combinación de drivers, librerías y herramientas que aún no igualan el ecosistema de NVIDIA. En un campo donde los ciclos de entrenamiento son largos y costosos, cada ineficiencia multiplica el retraso y el gasto.

Calendario en el aire y nueva configuración de hardware

Entrenamiento de modelos de IA en centros de datos

El modelo R2 era previsto para mayo, pero la brecha entre lo deseado y lo posible ha obligado a posponer su salida. DeepSeek está migrando el entrenamiento a GPU de NVIDIA H20, un hardware diseñado para el mercado chino que mantiene compatibilidad con CUDA dentro de los límites regulatorios vigentes.

Según fuentes conocedoras del proyecto, la compañía valora un esquema mixto: entrenar con H20 y reservar los Ascend para tareas de inferencia, donde las exigencias de cálculo y las dependencias de software son menores. Esta estrategia busca recuperar productividad sin renunciar a seguir mejorando la compatibilidad con soluciones locales.

La decisión implica también un ajuste de expectativas: después del buen resultado de R1, mayoritariamente entrenado con NVIDIA, R2 nació con la meta de rivalizar con los modelos punteros del sector. Mantener esa ambición exigirá ahora un calendario apretado con el objetivo de tener R2 listo en las próximas semanas bajo un entorno más estable.

Advertencias oficiales, dudas de seguridad y presión del mercado

Debate sobre seguridad y chips de IA

El regreso a NVIDIA llega en medio de recomendaciones de las autoridades chinas para limitar o evitar el uso de chips extranjeros por supuestas vulnerabilidades o funciones de rastreo. Pese a esas advertencias, DeepSeek prioriza por ahora el rendimiento y la estabilidad que necesita para cerrar el desarrollo de R2.

Este caso subraya la tensión latente entre soberanía tecnológica y tiempo de salida al mercado. Mientras la base industrial local acelera, los proyectos que compiten en la primera línea de IA generativa siguen apostando por el ecosistema que hoy ofrece mejor combinación de software, drivers y herramientas.

Internamente, y según señalan fuentes consultadas por la prensa, el fundador Liang Wenfeng ha mostrado su insatisfacción con el progreso de R2, empujando a su equipo a invertir más tiempo en un salto cualitativo que permita sostener el liderazgo técnico de la compañía.

Actores de la industria también reconocen que el enfoque de DeepSeek consolida su posición en el mercado, aunque la presión para entregar un modelo robusto y competitivo en plazos ajustados aumenta. El compromiso de la compañía con la innovación y la calidad refuerza su reputación en el sector.

Nvidia chips IA en China
Artículo relacionado:
Nvidia retoma la venta de chips IA H20 en China: contexto, claves y reacciones globales

Síguenos en Google News