The Sino-American tech race. Just how good can China get at generative AI?

Cita: 

The Economist [2023], "The Sino-American tech race. Just how good can China get at generative AI?", The Economist, London, 13 de mayo, https://www.economist.com/business/2023/05/09/just-how-good-can-china-ge...

Fuente: 
The Economist
Fecha de publicación: 
Sábado, Mayo 13, 2023
Tema: 
¿Puede China avanzar en el desarrollo de inteligencia artificial generativa?
Idea principal: 

En esta ocasión The Economist analiza las posibilidades de que China pueda competir en el campo de la inteligencia artificial (IA) generativa con la creación de modelos similares a ChatGPT y su motor GPT-4 frente al hegemón estadounidense y sus grandes empresas tecnológicas en medio de una lucha comercial que se ha traducido en sanciones al comercio de empresas chinas.

Tanto el gobierno estadounidense como el chino coinciden en que el desarrollo y consolidación de IA generativa jugará un papel esencial como herramienta para la competencia en el comercio de tecnologías de punta a nivel internacional. En este sentido, el gobierno chino ha enfatizado que necesita ser autosuficiente en los campos de ciencia y tecnología.

El desarrollo de chatbots inteligentes como ChatGPT representa además un factor de ventaja económica y militar en la lucha geopolítica del siglo XXI. La ventaja radica en el hecho de que la IA generativa es capaz de realizar tareas humanas tales como la redacción de escritos y creación de contenido audiovisual de maneras cada vez más eficientes.

Tanto China como Estados Unidos lideran diferentes campos en este nuevo sector de la industria tecnológica. China encabeza la producción de artículos y presentaciones sobre IA mientras que Estados Unidos posee un grupo de empresas que manejan modelos lucrativos con la creación de chatbots inteligentes, entre ellas empresas emergentes como OpenAI y Antropic, y a gigantes tecnológicos como Google, Meta y Microsoft. En tal caso, las grandes firmas tecnológicas chinas están aún rezagadas, por ejemplo, se dice que el chatbot del navegador Baidu (Ernie) es menos "inteligente" que sus competidores estadounidenses; otras empresas como Alibaba y Tencent tienen pendiente sus desarrollo de IA. Bajo esa lógica se estima que los avances chinos están dos a tres años por detrás de Estados Unidos (datos cruciales 1, 2, 3 y 4).

Las razones de este estancamiento chino son explicados por tres factores:

• Los datos: ciertamente, China ha liderado en el desarrollo de IA para el desarrollo de software de reconocimiento facial en colaboración con empresas como SenseTime o Megvii. Estos avances han sido impulsados porque sirven como herramienta para el control social que ejerce el gobierno chino. Sin embargo, ese avance palidece frente a la generación de IA generativa puesto que obedece a una lógica diferente ya que depende de la generación de texto extraída de la web, que en China son menos cuantiosos que en Occidente. En este caso, la carencia de datos también radica en el hecho de que aplicaciones famosas como WeChat o Weibo son las vías más adecuadas para los usuarios chinos que desean interactuar por internet porque su contenido no está indexado a la web, es por eso son conocidos como jardines amurallados (datos cruciales 5 y 6).

• El hardware: debido a los vetos al comercio chino de alta tecnología impuestos por Estados Unidos, la nación asiática no ha podido avanzar al ritmo que se requiere en este sector puesto que su industria que depende de semiconductores importados ha sido la más afectada. Los semiconductores son esenciales para un funcionamiento eficiente de los centros de datos; contar con los modelos de Occidente también les permitiría desarrollar una tecnología similar. Así, con los que cuenta actualmente no pueden competir aún con los poderosos semiconductores, por mencionar alguno, de Nvidia (datos cruciales 7 y 8).

• La experiencia: la exportación de conocimiento estadounidense está palideciendo en comparación con la población china que es recibida en Estados Unidos. Esto es esencial ya que los conocimientos técnicos de Estados Unidos son esenciales puesto que representan un imán tecnológico en el mundo, pero las condiciones de la pandemia y la guerra comercial chino-estadounidense han obstaculizado este tipo de intercambio (dato crucial 9).

Por su parte, el gobierno chino ha pretendido impulsar esta tecnología con un acceso más grande de datos para lo cual quiere desmantelar las murallas de las aplicaciones chinas. Además, los últimos modelos de IA generativa pueden jugar con los datos de diferentes idiomas indistintamente; de esta manera OpenAI pudo obtener buenos resultados en chino con material en ese idioma durante su entrenamiento. En tal caso, el modelo de IA generativa Ernie basó su entrenamiento sobre datos en inglés (dato crucial 10).

Otra de las vías para salir de ese atolladero es que los principios del código abierto pueden permitir que China tenga acceso a datos de modelos de IA generativa sin ningún costo (en este caso los "pesos" que definen la estructura de una IA generativa son costosos para su entrenamiento) y poder potenciar o crear modelos con capacidad similar a los de las grandes tecnológicas de Estados Unidos. Si anteriormente los chinos absorbieron los conocimientos tecnológicos de Occidente, esta es una ventaja que no pueden pasar por alto (dato crucial 12).

En el caso del hardware, las empresas chinas también han logrado eludir parte de las sanciones con la compra de semiconductores funcionales (pero no de la misma capacidad) a través de intermediarios. Eso ha permitido que la industria de semiconductores y aquellas que dependen de estos no se vea ralentizada (dato crucial 11).

Así se cree que todas estas alternativas, principalmente el código abierto, pueden permitir que tanto China como Estados Unidos estén a la par en el desarrollo de la IA generativa. No obstante, se piensa que dado la capacidad de difundir su vanguardia tecnológica hacia el mundo, Estados Unidos tiene mayores probabilidades de ampliar su ventaja, como sucedió con su competencia con Unión Soviética en 1950 que a pesar de que producían el doble de doctorados en ciencias, los estadounidenses terminaron imponiéndose.

Finalmente, aunque China sea más competitiva que el disuelto bloque soviético y a pesar de que le haya ido bien en la implementación de otras tecnologías, palidece en las áreas de computación en la nube y software comercial. Junto con eso, el control del estado de empresas y de la economía hace que los canales de difusión de vuelvan lentos en comparación con Estados Unidos y su amplia cantidad de tecnólogos que difunden innovaciones.

Los intentos por apoyar la industria tecnológica en China en algunos casos se han vuelto dudosos, puesto que impera el beneficio personal (dato crucial 13) o las restricciones del Partido Comunista Chino, en tal caso el gobierno teme que los chatbots difundan información que ponga en riesgo su dominio, lo cual también implica una ralentización al avance de esta industria como sucedió anteriormente con la represión de dos años y medio contra el sector tecnológico chino(dato crucial 14).

Datos cruciales: 

1) China superó a Estados Unidos en número de citas sobre artículos de inteligencia artificial (IA) en 2019. En 2021, 26% de las conferencias sobre IA procedían de China frente a 17% de Estados Unidos. Además 9 de cada 10 instituciones de publicaciones en el mundo sobre este rubro son chinas (medido en volumen de publicaciones). También se dice que los 5 principales laboratorios que trabajan en visión por computadora son chinos (una IA muy útil para el Partido Comunista Chino).

2) La gráfica 1 muestra diferentes categorías para medir los logros alcanzados en IA en China y Estados Unidos. Mientras China domina en investigaciones y publicaciones, los estadounidenses lideran en chips e investigación privada.

3) La gráfica 2 muestra el número de sistemas de Machine Learning importantes creados por Estados Unidos, Reino Unido y China. En este caso la supremacía estadounidense es innegable para el periodo analizado (2002-2022).

4) La gráfica 3 muestra el poder de cómputo en entrenamiento de los sistemas de IA. En este marco, GPT-4 al día de hoy no tiene un competidor que supere su capacidad.

5) De acuerdo con el sitio de investigación w3Techs, los sistemas de IA de estadounidenses se benefician del hecho de que 56% de los sitios web están en inglés frente a 1.5% en chino.

6) La carencia de datos puede explicar por qué el modelo computacional —quizás más complejo que GPT-4—chino presentado en 2021 con el nombre de Wu Dao 2.0 (a cargo de la empresa —respaldada por el estado— Artificial Beijing) pasó desapercibido.

7) Un análisis de 26 modelos chinos realizado por el Centro de Gobernanza de IA encontró que más de 50% dependía de los chips de la firma estadounidense Nvidia para su poder de procesamiento. Se dice que el fabricante chino de semiconductores más grande de China, Smic, ha fabricado prototipos solo una o dos generaciones detrás de la líder taiwanesa de semiconductores TSMC (que fabrica chips para Nvidia). No obstante se cree que la capacidad de producción de Smic es comparable con la capacidad de TSMC de hace 3 o 4 años.

8) La gráfica 4 muestra el tamaño de los nodos de semiconductores para las empresas Smic, Intel, Samsung y TSMC. Claramente se observa que los semiconductores de la china Smic no son tan complejos en tamaño como los de la competencia estadounidense, coreana y taiwanesa.

9) Cerca de 66% de los expertos en IA que presentan trabajos sobre este ramo son extranjeros, de este volumen para 2019 los ingenieros chinos representaban 27%. Asimismo, en la primera mitad de 2022, Estados Unidos otorgó la misma cantidad de visas a estudiantes chinos que en 2019.

10) En febrero de 2019, las autoridades locales de Beijing (donde residen cerca de 33% de las empresas de aviación china) prometieron publicar datos de 115 organizaciones afiliadas al estado, dando a los constructores de modelos de IA, 15 880 conjuntos de datos para trabajar.

11) En marzo de 2023, Financial Times informó que la firma china SenseTime (que se encuentra en la lista negra de Estados Unidos) estaba utilizando intermediarios para eludir los controles de exportación. En este sentido, Nvidia ha diseñado dispositivos que cumplen con las sanciones y que son de 10-30% más lentos que los de la gama alta.

12) Los investigadores de Standford usaron los "pesos" de Llama (el modelo de IA de Meta) para construir su propio modelo de IA nombrado Alpaca por menos de 600 dólares en comparación con los 100 millones de dólares que cuesta hacer algo como GPT-4. En este sentido, Alpaca funciona bien para realizar tareas básicas como los primeros modelos de ChatGPT.

13) El “Gran fondo” para chips de China ha estado envuelto en escándalos poniendo en duda su reputación. En 2014 recaudó 50 mil millones de dólares con el objetivo de respaldar a empresas nacionales de semiconductores.

14) En 2022 las inversiones privadas en nuevas empresas chinas de IA ascendió a 13.5 millones de dólares, menos de 33% de la suma que se les debía a sus rivales estadounidenses. De acuerdo con PitchBook, en los primeros meses de 2023, la brecha de financiación parece haberse ampliado.

Nexo con el tema que estudiamos: 

El artículo aporta una evaluación más completa sobre la competencia en escala global en el campo de la IA. En general se considera que China lleva la ventaja por sus grandes avances en tecnologías de reconocimiento facial y el volumen de datos que circulan en sus redes. Sin embargo, The Economist llama la atención sobre las maneras en que esos datos están compartimentados y las afectaciones que derivan de las sanciones económicas. En términos generales, hay que considerar que la ventaja material (geoeconómica) de China solo es una condición de liderazgo, que requiere de grandes inversiones y esfuerzos para realizarse.

En este caso, la competencia por dominar la inteligencia artificial generativa ha comenzado y representa un nuevo hito en este capítulo de Guerra fría 2.0. Es menester pensar que el ganador de esta contienda se haga con el título del mayor creador de tecnología en el mundo y un correspondiente control geopolítico.