Artificial intelligence. The latest AI can work things out without being taught. Learning to play Go is only the start

Cita: 

The Economist [2017], "Artificial intelligence. The latest AI can work things out without being taught. Learning to play Go is only the start", The Economist, London, 21 de octubre, https://www.economist.com/news/science-and-technology/21730391-learning-...

Fuente: 
The Economist
Fecha de publicación: 
Sábado, Octubre 21, 2017
Revista descriptores: 
Tema: 
La inteligencia artificial ya es capaz de resolver problemas a través del aprendizaje supervisado
Idea principal: 

La inteligencia artificial (IA) ha generado tanto fascinación como miedo entre los seres humanos. En general, a la gente le asombra la capacidad que tienen los sistemas computacionales para aprender y solucionar problemas como lo haría un ser humano. Sin embargo, esto también genera temor entre la humanidad porque se piensa que esta tecnología nos puede sustituir e incluso dominar.

Los sistemas de aprendizaje tecnológicos de la IA se han utilizado para competir contra seres humanos en juegos como el ajedrez y el go, pero también para identificar imágenes, reconocer discursos humanos, filtrar los spams de manera eficiente, entre otros. A pesar de esto, Demis Hassabis -jefe de la empresa inglesa DeepMind- argumenta que el aprendizaje de este tipo de IA se enfrenta a un límite: la información con la que se entrena a la computadora se basa en la experiencia humana, por lo que las inhabilidades humanas se transmiten a las máquinas.

Además, muchos de los recursos básicos utilizados por estos programas son suministrados por los humanos. Por ejemplo, para el reconocimiento de imágenes, los seres humanos tienen que hacer una base de datos de miles de fotografías en donde se etiqueta a las personas para que las máquinas puedan reconocerlas. Esto no sólo implica pérdida de tiempo y gastos monetarios significativos, también trae consigo algunos problemas por la incapacidad que se tiene para contar con una base representativa abierta.

A pesar de esto, este tipo de obstáculos comienzan a ser superados. De hecho, la inteligencia artificial ya puede resolver problemas sin que se le enseñe cómo hacerlo. El prototipo de esta innovación es un programa de computadora llamado AlphaGo, el cual aprendió a jugar go -juego fundamental para la cultura china, japonesa y coreana que se equipara al ajedrez en Occidente- y venció a su primer rival humano en 2016. Ya desde 1997, Deep Blue, una computadora de IBM, había vencido a Gary Kasparov en una partida de ajedrez. Empero, durante esos años, ninguna máquina había logrado derrotar a un jugador de go.

Esta situación cambió en 2016, cuando Lee Sedol, uno de los mejores jugadores de Go, perdió tres de cuatro partidas contra AlphaGo, un programa creado por la empresa DeepMind. Después de esa victoria, AlphaGo volvió a vencer a jugadores famosos de go en juegos en línea y en mayo venció al mejor jugador de go: Ke Jie. Frente a esta realidad, la pregunta que invadió los cerebros de muchos era cómo una computadora había logrado vencer a personas tan versadas en el juego go.

La respuesta a este cuestionamiento es justamente el aprendizaje supervisado, un tipo de inteligencia artificial que propone la autoenseñanza de las computadoras para realizar tareas complicadas. Lo que hizo AlphaGo para derrotar a estos jugadores fue estudiar miles de juegos entre expertos humanos para esquematizar las reglas y estrategias que se seguían. Posteriormente, la máquina mejoró esas tácticas con millones de juegos en donde la computadora jugaba contra sí misma.

El “Go es fácil de aprender, pero difícil de dominar”, lo cual se debe, en gran medida, al amplio número de posibilidades de movimientos que tienen los jugadores. El tablero, que tiene 19 líneas horizontales y 19 verticales, ofrece 361 opciones para colocar las fichas de manera inicial (19x19). El jugador que continúa con la partida tendrá 360 opciones y así se irán reduciendo en cada turno. De tal suerte, el número total de opciones en un juego es de aproximadamente 10 a la 170, lo cual desafía a cualquier analogía física, ya que esta cantidad es mayor que el número estimado de átomos en el universo observable (10 a la 80).

En el go hay dos colores de piedras: blancas y negras. El objetivo principal del juego es controlar el territorio del oponente rodeando sus fichas para eliminarlas del tablero. El juego continúa así hasta que ambos deciden detenerlo. Después, cada uno suma sus piedras en el tablero y luego las intersecciones que rodeó, de manera que el que tenga el total más grande gana.

Las reglas son simples, no obstante, los jugadores expertos se preocupan por entender el juego a un nivel superior. De hecho, han construido una serie de conceptos para explicar la estructura del juego. Las computadoras no tienen la habilidad de entender estos términos como lo hacen los seres humanos, debido a que nuestros procesos de aprendizaje son distintos. Por ejemplo, un novato humano puede extrapolar la estructura de una escalera en su juego (patrones diagonales de piedras que se construyen con la intención de capturar un grupo de piedras del oponente) y determinar qué tan viable es dicha construcción para ganar. La máquina no puede hacer dicha extrapolación y tiene que experimentar de manera aleatoria, por lo que tarda más en adoptar dichos términos. No obstante, los programas pueden comprender los conceptos humanos por medio del aprendizaje supervisado.

A pesar del gran éxito tecnológico de AlphaGo, los investigadores de DeepMind aseguraron que el programa se puede mejorar. En un artículo publicado en la revista Nature señalaron que la versión más reciente de la máquina, AlphaGo Zero, aprende más rápido, requiere menos hardware informático y aprende por sí misma sin recurrir a expertos humanos, lo cual es fascinante y aterrador.

Los límites humanos que tenía AlphaGo pretenden ser superados por su sucesor: AlphaGo Zero. Este proyecto no necesitará de la etapa de entrenamiento e iniciará directamente con las reglas del juego. La máquina tendrá una “función de recompensa” para maximizar sus capacidades por medio de victorias. De esta forma, lo que se busca es que el programa experimente con los juegos de sus versiones anteriores para mejorar en cada partida.

El programa inició poniendo fichas de manera aleatoria, pero después de un día ya podía jugar a nivel profesional y en dos días superó a AlphaGo. AlphaGo Zero ha aprendido por sí misma cosas que se les enseñan a los seres humanos. Joseki, que son “secuencias especializadas de movimientos bien conocidos que toman lugar en las orillas del tablero” fueron descubiertas por AlphaGo Zero, pero además, el programa innovó y creó sus propios ordenamientos.

Las habilidades de Go y otros juegos se pueden clasificar en el ranking Elo, que analiza las probabilidades que tiene un jugador para ganar frente a otro basándose en sus actuaciones pasadas. Según datos estadísticos de este ranking, es imposible que algún ser humano logre vencer a AlphaGo Zero.

Aunque los algoritmos de AlphaGo Zero sólo se han utilizado en juegos de go, estos podrían ser usados con otros fines, como identificar moléculas útiles para la medicina, saber cómo las proteínas se doblan hasta alcanzar su conformación nativa, simular reacciones químicas con precisión, entre otros. De hecho, DeepMind ha ayudado a Google a reducir el consumo de energía de sus centros de información con base en la información y capacidades del programa que DeepMind ha desarrollado.

El hecho de que las computadoras tengan la capacidad de resolver algoritmos sin una instrucción humana significa que también podrían resolver problemas que los humanos no podemos solucionar. No obstante, Deep Mind considera que la inteligencia artificial puede ser un gran asistente, más no un sustituto, de los cerebros humanos. The Economist agrega que estos avances pueden impulsar a los humanos a buscar caminos nuevos y ser más productivos, debido a que con ellos se cuestiona el viejo conocimiento y se fomenta la innovación.

Finalmente, el aprendizaje supervisado no sólo es funcional para las máquinas, también los humanos se pueden beneficiar de él. Por ejemplo, Ke decidió estudiar los movimientos de la computadora y aprender nuevas técnicas después de las derrotas que sufrió frente a AlphaGo Zero, las cuales aplicó, posteriormente, en contra de adversarios de su nivel. En estas contiendas Ke ganó de manera contundente, demostrando las habilidades que había adquirido a través del aprendizaje supervisado. De tal suerte, el avance de las máquinas también puede ser útil para la humanidad.

Datos cruciales: 

Si ambos jugadores tienen el mismo ranking Elo, entonces cada uno tiene 50% de probabilidades de ganar, pero si alguno de ellos está 200 puntos por debajo del otro, entonces éste sólo tendrá 25% de probabilidades de ganar.

Lee Sedol tiene un ranking Elo de 3 526 puntos y Ke Jie uno de 3 661. Por su parte, AlphaGo Zero alcanzó uno de 5 000 en 40 días.

Nexo con el tema que estudiamos: 

La "solución" de problemas es una de las principales fronteras de la inteligencia artificial. Hasta ahora y como lo prueba el aprendizaje supervisado, el poder de procesamiento y la alimentación masiva de información ha logrado avances decisivos en ambientes controlados, es decir en ambientes donde existen reglas establecidas y conocidas de antemano por los autómatas como es el caso del go. Este tipo de inteligencia artificial tiene un gran potencial para la automatización de la producción capitalista cuya "epistemología" productiva tiende a la descomposición y la repetición masivas. En ese sentido, y a pesar de sus impresionantes logros, la inteligencia artificial es principalmente una mejora sustancial de las máquinas.

El paso decisivo reside en lograr la reproducción del procesamiento que llamamos intuitivo, terreno que en términos de la mente humana aún está poco codificado. Las ciencias cognitivas tienen una gran tarea por delante para comprender cómo se crea el conocimiento humano en tanto resultado de todas nuestras facultades de percepción y reflexión.

Es impresionante la manera en la que la tecnología está avanzando. La Inteligencia Artificial (ampliamente representada en las películas) es una de las que más asombro ha generado entre la población del mundo, pero también es una de las que más preocupaciones ha difundido, debido a que se piensa que las máquinas van a sustituir a los humanos y que éstas dominarán el orbe.

Sin embargo, el temor más grande debería estar vinculado con el sujeto que genera, produce y controla esta tecnología, porque es éste quien podría ejercer políticas que busquen coartar la capacidad de agencia de los seres humanos. Los sujetos capitalistas son quienes controlan estos avances científico-tecnológicos y el problema fundamental radica en que dichos sujetos han demostrado que el bienestar de las personas jamás figurará entre sus objetivos. El desarrollo de la Inteligencia Artificial podría ser benéfico para el sistema capitalista, porque le permitiría tener más ganancias con menos insumos. Sin embargo, esto empeoraría la condición social de la inmensa mayoría, porque sólo incrementaría la brecha de desigualdad entre las diferentes personas alrededor del mundo.