DeepSeek, IA y chips: ¿es posible contener tecnológicamente a China?


En la actual guerra fría tecnológica entre Washington y Pekín, Estados Unidos ha intentado frenar el desarrollo de inteligencia artificial en China prohibiendo la exportación de chips avanzados. Sin embargo, la eclosión de DeepSeek ha mostrado que China es capaz de innovar a pesar de este contexto desfavorable, y está en camino de crear un modelo tecnológico autónomo que puede rivalizar con el estadounidense.
La aparición de la inteligencia artificial china DeepSeek-R1 ha generado un terremoto empresarial y político en Estados Unidos. Después de que se mostrara que este modelo de IA chino era comparable a los más avanzados del mercado estadounidense, las acciones de la empresa de chips Nvidia cayeron un 17% -una pérdida de 600.000 millones de dólares en valor de mercado-. Competidores directos como el CEO de OpenAI, Sam Altman, se vieron obligados a admitir que el modelo de DeepSeek era «impresionante». Entre la clase política y la burocracia de Washington saltaba la alarma: la aparición de modelos punteros de IA china era precisamente lo que las duras políticas tecnológicas hacia Pekín de la saliente administración Biden habían querido impedir.
La aparición de este nuevo modelo de DeepSeek se revelaba como un «momento Sputnik» que avisaba a Washington de que Pekín estaba más cerca de lo que pensaba en la carrera de desarrollo de la IA, una tecnología que tanto Estados Unidos como China ven como central para conseguir el liderazgo tecnológico, económico y militar de las próximas décadas.
La estrategia de semiconductores estadounidense
Desde la primera legislatura de Donald Trump, la tecnología ha sido el campo fundamental en el que se ha librado la rivalidad entre Estados Unidos y China. Ambas potencias han entendido, desde hace décadas, que la tecnología tiene fuertes implicaciones políticas: a finales de la década de los 2000, China bloqueó las redes sociales estadounidenses; en el primer mandato de Trump, Estados Unidos lanzó una ofensiva contra la empresa china Huawei para evitar que proveyera la infraestructura 5G de Estados Unidos y países aliados. En los últimos años, sin embargo, el campo de la inteligencia artificial y los grandes modelos de lenguaje, LLM (Large Language Models, en inglés), como ChatGPT, han sido prioridad para Washington y Pekín. Ambas potencias consideran que la inteligencia artificial podría generar enormes ventajas comparativas en términos económicos y militares. Por ello, han lanzado estrategias duales de incentivar con política industrial el desarrollo propio de este tipo de tecnología, a la vez que ponen palos en las ruedas del rival.
La estrategia de Estados Unidos para frenar el desarrollo de IA puntera en China -y así mantenerse como la potencia dominante en este sector- ha sido restringir la venta de chips avanzados al mercado chino. Los semiconductores avanzados son fundamentales para uno de los tres ejes en los que se estructura la IA: el poder computacional (los otros dos son los datos y los algoritmos). La acumulación de chips avanzados en enormes centros de datos es lo que genera la potencia computacional necesaria para entrenar los modelos más punteros de IA. Cuanto más poder computacional está al alcance de una compañía tecnológica, más capacidad tiene para entrenar modelos pioneros de IA. Por ello, para la administración Biden, imponer restricciones a la exportación de chips avanzados a China era una manera de reducir y dañar sus niveles de poder computacional y, por ende, su capacidad de crear modelos de IA punteros. Sin centros de datos repletos de chips avanzados como los americanos -decía el argumento- China no sería capaz de avanzar sustancialmente en el desarrollo de IA.
La estrategia de restricción de chips americana no ha estado exenta de fallos. Poco después de su implementación, se publicaron informaciones de que China seguía comprando chips punteros de Nvidia en el mercado negro; además, compañías chinas seguían entrenando sus IA a través de la nube, accediendo al poder computacional de centros de datos en el Sureste Asiático. Controlar objetos físicos como los chips no era tan fácil como controlar flujos financieros para aplicar sanciones, algo que la administración estadounidense había hecho en los últimos años. De hecho, poco antes de dejar su cargo, el presidente Biden impuso todavía más restricciones a la exportación de chips, penalizando a países aliados como Vietnam o Polonia, para evitar que China accediera a poder computacional a través de terceros países. Sin embargo, la percepción general estadounidense era que China seguía bastante por detrás de los americanos en desarrollo de IA.
DeepSeek y la autonomía tecnológica china
El anuncio de DeepSeek-R1 ha sido un contundente jarro de agua fría para la administración estadounidense. Más allá del mérito en sí de crear una IA puntera, lo que destaca del caso de DeepSeek es que su nuevo modelo ha necesitado mucho menos poder computacional para conseguir resultados similares a los estadounidenses. Para entrenar su modelo, la compañía china ha necesitado 10 veces menos inversión en poder computacional que Meta; las grandes tecnológicas suelen usar centros de datos con alrededor de 16.000 chips de Nvidia, mientras que DeepSeek sólo usó unos 2.000. Tener menos acceso a poder computacional -al contrario de lo que se afirmaba- no necesariamente bloqueaba la capacidad de crear modelos de IA punteros. La teoría en la que se fundamentaba la estrategia tecnológica de Washington hacia China se ha agrietado.
El logro de DeepSeek, sin embargo, no quiere decir que los chips o centros de datos ya no sean necesarios o importantes. De hecho, el CEO de la compañía china ha reconocido que el mayor desafío que tienen es la falta de acceso a semiconductores avanzados. Sin embargo, el éxito de DeepSeek es una demostración de que China está siendo capaz de adaptarse, innovar y crear un ecosistema tecnológico autónomo más resiliente a la presión estadounidense. Este era uno de los peligros de la estrategia de Biden: restringir el acceso a tecnología estadounidense puede dañar a China en el corto plazo, pero en el largo plazo la incentiva a construir un sistema tecnológico autónomo mucho menos expuesto y dependiente de tecnología estadounidense. Con todo, la administración Biden consideró que el momento era crítico, y limitar el acceso a poder computacional a China en el presente era más importante que tener capacidad de influencia en su economía en el futuro. Este no era el único inconveniente: implementar restricciones a la exportación también erosiona las cadenas de suministro mundiales y corta una importante fuente de ingresos a empresas como Nvidia, que después puede reinvertir en investigación y desarrollo. En resumen: imponer restricciones daña el desarrollo chino, pero también los flujos económicos e intercambios internacionales que favorecen la innovación.
En cualquier caso, después del pánico que ha generado el nuevo modelo de DeepSeek -y en un contexto de securitización de las economías y formación de un eje tecnológico-patriótico entre Trump y Silicon Valley- lo más probable es que la nueva administración americana recrudezca la mentalidad de carrera armamentista que existe en el campo de la IA. A la vez, un modelo que necesita menos poder computacional, y es de código abierto como el de DeepSeek, abre la puerta y reduce los costes de entrada a nuevos actores en el ecosistema de la IA, como por ejemplo países en desarrollo o empresas medias, además de disruptores como Rusia, Corea del Norte o grupos terroristas. Una bipolaridad tecnológica más tensa entre Estados Unidos y China podría coexistir con una mayor democratización y entrada de nuevos actores en la carrera tecnológica de la IA.
Palabras clave: IA, DeepSeek, China, Estados Unidos, chips, LLM, rivalidad tecnológica, Nvidia, restricciones, poder computacional, securitización
Todas las publicaciones expresan las opiniones de sus autores/as y no reflejan necesariamente los puntos de vista de CIDOB como institución