DeepSeek V4 ha debutado como una versión preliminar de su modelo de lenguaje más ambicioso hasta la fecha, con 1,6 billones de parámetros y una ventana de contexto de un millón de tokens. El lanzamiento es relevante no solo por su escala, sino porque llega optimizado para chips Ascend de Huawei, en un momento de máxima tensión entre Washington y varias empresas chinas de inteligencia artificial.
La presentación de DeepSeek V4 coincidió además con nuevas acusaciones del Gobierno de Estados Unidos sobre un presunto uso indebido de propiedad intelectual por parte de DeepSeek y otras compañías chinas. La secuencia de ambos movimientos ayuda a entender que la competencia en IA ya no se libra solo en el terreno técnico, sino también en el regulatorio y el diplomático.
DeepSeek V4 apuesta por Huawei y deja a Nvidia fuera de la ecuación
Según la información difundida por la compañía, DeepSeek V4 es el primer gran lanzamiento de frontera de la firma diseñado específicamente para procesadores de Huawei y no para hardware de Nvidia. Ese detalle importa porque durante años gran parte del avance de la IA generativa ha dependido de los chips de la empresa estadounidense, mientras que China trata de consolidar una alternativa doméstica más sólida.
DeepSeek asegura que su nuevo modelo se ha entrenado sobre la infraestructura Ascend de Huawei y que es compatible desde el primer día con toda la línea Ascend SuperNode, incluidos los procesadores 950 más recientes. La compañía también sostiene que el precio de uso del modelo podría bajar más adelante si Huawei consigue ampliar la producción de esos chips en la segunda mitad del año.
La empresa lanza DeepSeek V4 en dos variantes: V4-Pro, la versión principal, y V4-Flash, una edición más pequeña. La primera fija un coste de 3,48 dólares por millón de tokens de salida, mientras que la segunda baja a 0,28 dólares. Es una diferencia importante frente a los precios de referencia de otros modelos cerrados del mercado, aunque la comparación no puede hacerse solo por tarifa, sino también por calidad, estabilidad y facilidad de integración.
Qué promete DeepSeek V4 frente a sus rivales
DeepSeek admite que DeepSeek V4 todavía queda por detrás de los mejores modelos cerrados de OpenAI y Anthropic, pero afirma que la distancia es de entre tres y seis meses de desarrollo. Más allá de esa autoevaluación, la compañía sostiene que su nuevo sistema supera a otros competidores de código abierto en tareas de programación orientada a agentes y en razonamiento.
Esa afirmación debe leerse con cautela. En el mercado de la IA, los comunicados de lanzamiento suelen mezclar datos técnicos, comparativas internas y mensajes comerciales. Aun así, el tamaño del modelo, la ventana de contexto de un millón de tokens y la decisión de apoyarse en chips Huawei sitúan a DeepSeek V4 como una pieza estratégica dentro del ecosistema chino.
También hay una lectura económica. Si DeepSeek consigue operar con una infraestructura doméstica más accesible y escalable, podría reducir parte de su dependencia de la cadena de suministro extranjera. Eso no elimina las limitaciones de producción, ni resuelve por sí solo los cuellos de botella del sector, pero sí marca una dirección clara: menos exposición a las restricciones de exportación impuestas desde Estados Unidos.
EE. UU. intensifica las acusaciones sobre robo de propiedad intelectual
El lanzamiento de DeepSeek V4 se produjo el mismo día en que Reuters informó de que el Departamento de Estado de Estados Unidos había enviado una comunicación diplomática a embajadas de todo el mundo. El objetivo era advertir a gobiernos extranjeros sobre lo que Washington considera extracción y destilación indebidas de modelos estadounidenses por parte de DeepSeek y otras empresas chinas de IA.
Dos días antes, la Oficina de Política Científica y Tecnológica de la Casa Blanca había publicado un memorando en el que acusaba a entidades chinas de llevar a cabo campañas deliberadas e industriales para destilar sistemas de IA de frontera desarrollados en Estados Unidos. La expresión es importante: la “destilación” alude a técnicas para extraer comportamiento, capacidades o respuestas de un modelo a partir de interacciones masivas con él, con el fin de reproducir parte de sus resultados en otro sistema.
Estas acusaciones no son nuevas. En febrero, Anthropic aseguró que DeepSeek, Moonshot y MiniMax utilizaron 24.000 cuentas fraudulentas para realizar 16 millones de intercambios con su modelo Claude. OpenAI también ha acusado a DeepSeek de destilar sus modelos. China, por su parte, ha rechazado esas afirmaciones y las ha calificado de infundadas.
DeepSeek V4 y el pulso tecnológico entre China y EE. UU.
El caso de DeepSeek V4 encaja en un momento especialmente delicado para el sector. El lanzamiento llega pocas semanas antes de la visita prevista del presidente estadounidense Donald Trump a Pekín para reunirse con Xi Jinping, un encuentro en el que se espera abordar controles a la exportación de semiconductores y disputas sobre propiedad intelectual.
La coincidencia temporal no parece casual. A medida que la IA se vuelve más estratégica, los gobiernos están usando sus embajadas, sus organismos de control y sus empresas tecnológicas como parte de una misma disputa. En ese tablero, DeepSeek se mueve en una posición incómoda: por un lado intenta demostrar que puede competir con modelos occidentales; por otro, queda en el centro de sospechas cruzadas sobre cómo se han construido esos avances.
También conviene poner en contexto el salto de hardware. DeepSeek ya había entrenado su modelo V3 sobre 2.048 GPU Nvidia H800, un dato que alimentó investigaciones sobre si la empresa obtuvo chips restringidos a través de intermediarios en Singapur. Con DeepSeek V4, la compañía trata de dejar atrás esa dependencia y mostrar que puede apoyarse en infraestructura china sin renunciar a la ambición técnica.
En términos de mercado, el lanzamiento refuerza dos tendencias a la vez: la consolidación de modelos abiertos o parcialmente abiertos como alternativa a los sistemas cerrados, y la fragmentación geopolítica de la IA en bloques con hardware, software y normas cada vez más diferenciados. Si DeepSeek logra sostener el ritmo de desarrollo sobre chips Huawei, el proyecto servirá como prueba de hasta dónde puede llegar China sin recurrir a Nvidia. Si no lo consigue, quedará como otro ejemplo de una carrera en la que la capacidad técnica y la autonomía industrial siguen avanzando a velocidades distintas.
