Artificial intelligence and Go. Showdown. Win or lose, a computer program’s contest against a professional Go player is another milestone in AI
The Economist [2016], "Artificial intelligence and Go. Showdown. Win or lose, a computer program’s contest against a professional Go player is another milestone in AI", The Economist, London, 12 de marzo, http://www.economist.com/news/science-and-technology/21694540-win-or-los...
El artículo toma como ejemplo el software AlphaGo para ilustrar el avance del “aprendizaje profundo” (deep learning) en la inteligencia artificial.
AlphaGo es un software creado por la empresa de inteligencia artificial DeepMind, comprada por Google en 2014, que en marzo ganó el antiguo juego chino Go a uno de los campeones mundiales, Lee Sedol.
Go es un juego muy popular en el este asiático con una enorme cantidad de jugadas y estrategias posibles, lo que había dificultado a todos los programas anteriores obtener una victoria frente a las decisiones humanas. Otros juegos y videojuegos ya han sido “solucionados” por un software, como el ajedrez, que en 1997 fue ganado por una computadora llamada Deep Blue.
Los juegos más simples pueden resolverse a través de la “fuerza bruta matemática”. Antes de AlphaGo, el juego con más movimientos calculados eran las damas chinas con cien mil millones de millones de combinaciones posibles en un tablero de 8x8 casillas. Sin embargo, Go posee un tablero de 19x19 lo que eleva las combinaciones a “cientos de órdenes de magnitud más que el número de átomos en el universo”, dado que cada jugada tiene por lo menos 250 movimientos posibles que a su vez tiene otros 250 movimientos y así, hasta que el juego termina. Esta complejidad hace a Go inmune al uso de la fuerza bruta matemática de una computadora.
Otros juegos, como el ajedrez, requieren una mayor intuición además de la capacidad de calcular movimientos. El ajedrez tiene un tablero menor y reglas restrictivas, sin embargo, no es posible usar el mismo método que en las damas chinas. Los programas de ajedrez filtran las opciones conforme avanza el juego y eligen las mejores jugadas gracias a un mecanismo que permite al software entender si una posición es mejor que otra y asigna valores a las diferentes piezas del ajedrez, por ejemplo: un peón vale menos que un caballo y éste menos que la reina.
Sin embargo, en Go, las piezas tienen valores diferenciados según su posición en el tablero, lo que cambia con cada movimiento y, a diferencia del ajedrez, la estructura del juego adquiere forma conforme avanza la partida y no antes. A pesar de que existen estrategias, estas no son tan sistemáticas como en el ajedrez, sino que responden mayoritariamente a la intuición.
Los creadores de AlphaGo desarrollaron características innovadoras de inteligencia artificial para vencer a Sedol: el aprendizaje profundo, es decir, aprender a pensar como la mente humana a partir de la observación. El aprendizaje profundo requiere dos cosas: mucho trabajo de procesamiento y mucha información que aprender. DeepMind entrenó a su máquina con 30 millones de jugadas tomadas de salas virtuales de jugadores de Go y con una versión un poco más atrasada de sí misma, lo que le permitió generar más información de ensayo.
Con esa información se generan dos algoritmos de aprendizaje profundo: la red de política y la red de valor. El primero sirve para imitar el comportamiento humano en los juegos: después de observar millones de juegos, la computadora aprende a extraer características, principios y reglas generales. Con esta información, se aplica el segundo algoritmo para evaluar qué tan fuerte es un movimiento: la máquina juega los movimientos sugeridos por la red de política haciendo contra jugadas y compara los resultados con los juegos que ha visto antes. Con ambos algoritmos, la computadora adquiere la sabiduría que los humanos acumulan en años de práctica.
Además de los algoritmos, AlphaGo requiere un alto poder de procesamiento: 1,920 procesadores estándar y 280 procesadores para videojuegos. Además, cuenta con un par de características artesanales en el código que le dan consejos a la máquina.
El aprendizaje profundo es una un campo con un futuro promisorio y rentable. Entre otras aplicaciones, puede usarse para enseñar a las computadoras a reconocer rostros, traducir lenguajes, elegir la publicidad adecuada para cada usuario de internet y ha consolidado otras funciones como el reconocimiento de voz e imagen. Google, Facebook y Baidu ya están invirtiendo en el aprendizaje profundo.
Más importante aún, el aprendizaje profundo es la base de la inteligencia artificial general, es decir, de una que muestre “el mismo tipo de inteligencia amplia y fluida, como la de un ser humano”. Los videojuegos son una herramienta muy útil para enseñar a una computadora a pensar como los seres humanos.
No obstante, la inteligencia artificial apenas está avanzando, queda un largo camino por recorrer. Por ejemplo, las máquinas como AlphaGo no pueden razonar por analogía, es decir, no pueden aplicar un conocimiento aprendido a tareas similares, sólo a aquellas para las que fue programada. Estas máquinas tampoco tienen metas ni conciencia de su propia existencia.
El artículo describe el rápido avance en el campo de la inteligencia artificial y del aprendizaje profundo. La participación de empresas como Google es crucial, puesto que a la par están desarrollado otras habilidades para las computadoras, como reconocimiento de voz e imagen. Estas herramientas, en conjunto, permiten su refinamiento y aplicación a otros sectores de la vida social: comerciales, culturales y, por supuesto, militares; lo que hace de este campo uno altamente rentable y que seguramente tiene muchas innovaciones por presentar.