Machine learning. A sense of curiosity is helpful for artificial intelligence. Another approach to training machines

Cita: 

The Economist [2018], "Machine learning. A sense of curiosity is helpful for artificial intelligence. Another approach to training machines"The Economist, London, 1 de septiembre, https://www.economist.com/science-and-technology/2018/09/01/a-sense-of-c...

Fuente: 
The Economist
Fecha de publicación: 
Sábado, Septiembre 1, 2018
Tema: 
Las innovaciones en los procesos de aprendizaje de la inteligencia artificial
Idea principal: 

Existen dos maneras en que los humanos supervisan cuando un software está aprendiendo. La primera es con algoritmos con grandes conjuntos de datos que describan cierta tarea, por ejemplo, etiquetando imágenes de perros y gatos para que la máquina aprenda a discriminar. La segunda forma de supervisión consiste en determinar un objetivo específico dentro de un entorno altamente estructurado, como establecer un puntaje alto en un videojuego y dejar al algoritmo probar muchas posibilidades hasta que alcance ese objetivo.

Estas dos formas de "aprendizaje supervisado" ya han tenido avances en la inteligencia artificial (AI). En 2012, un equipo de la Universidad de Toronto, usando el primer método logró desarrollar el software AlexNet, que logró reconocer 1 de 10 imágenes más que el software más cercano. Con el segundo método, una empresa de Alphabet especializada en AI llamada DeepMind le enseñó a un software a jugar Atari y Go (un juego de tablero) de forma sobrehumana.

Sin embargo, el aprendizaje supervisado tiene algunos defectos. Es costoso, pues implica trabajo manual para etiquetar datos o diseñar entornos virtuales; estos procesos, diseñados para enseñar una función particular, no pueden usarse para otras lecciones. Otro factor es la inconsistencia de estos métodos con la realidad, ya que el mundo no está etiquetado ni da señales explicitas del progreso de cierto aprendizaje. El consumo de electricidad es otro problema debido a que los millones de ejemplos y simulaciones necesarias para que este tipo de software funcione necesita computadoras potentes con un alto consumo de electricidad.

La curiosidad es una forma distinta de aprendizaje que se perfila como un método que podría aportar aún más a la AI. El Dr. Oudeyer -investigador del Instituto nacional de ciencias de la computación de Francia- ha desarrollado junto con otros investigadores un mecanismo de agentes artificiales que usan sus propios sistemas intrínsecos de recompensas para recopilar datos del entorno a su alrededor, en lugar de entrenar algoritmos con funciones creadas por humanos.

La primera generación de AI “curiosa” funciona a partir de la "predicción de errores", que detecta aquellos elementos que se desvían de aquello que el software o agente predijera encontrar, es decir, encontrar la información novedosa en el entorno. Si bien este método funciona, tiene errores importantes, como algunos escenarios con resultados inútiles. Por ejemplo, al observar autos circulando, un software podría enfocarse en la secuencia de distintos colores, o en otro caso, insistir en saltar unas escaleras antes que aprender a caminar.

Para solucionar este problema el software debe concentrarse más en el ritmo o tasa del error antes que en el error en sí. De esta forma, puede establecerse un tipo de "umbral de aburrimiento". De esta forma, en el caso del robot que observa autos al pasar, el software se "aburriría" de no poder encontrar una secuencia de colores y detendría ese proceso de aprendizaje.

El Dr. Oudeyer llevó estos algoritmos de curiosidad a pruebas prácticas en un experimento llevado a cabo en junio en Francia, con uno de cada 600 niños de primaria en la región de Aquitaine. Se buscó crear un sistema llamado KidLearn, donde se modelaron las formas en que cada niño aprende individualmente matemáticas y a partir de ahí se le presentan ejercicios que le permitan un aprendizaje individual más eficiente. A diferencia de otros sistemas que con información de un grupo de niños moldean programas de aprendizaje para todos los demás, sin considerar las particularidades de cada uno, KidLearn trata a cada niño como un agente curioso, y adapta el contenido de aprendizaje para adaptarse al nivel de comprensión y progreso de ese niño.

El aprendizaje por curiosidad ha sido bien recibido en Sillicon Valley. Deepak Pathak y sus colegas de la Universidad de Berkeley y OpenAi, una empresa de investigación no lucrativa respaldada por Elon Musk, sacaron un artículo donde muestran el éxito de la curiosidad como forma de aprendizaje en muchos entornos virtuales diferentes.

A pesar de no enseñarle al agente el contenido de un videojuego de bloques, el agente logró alcanzar altos puntajes, ya que el patrón cambiaba conforme el nivel subía y eso era más estimulante. En Pong, dos agentes bloquearon el juego al descubrir que era más divertido “pelotear” que ganar. Morir en los videojuegos resulta aburrido para un agente curioso, ya que lo devuelve al inicio del juego, el cual ya conoce y lo puede predecir.

Existen otras formas para fomentar la "curiosidad de explorar" de un software. Una de ellas consiste en imitar la evolución, como ha hecho Kenneth Stanley, un investigador del laboratorio de AI de Uber en San Francisco. Funciona a partir de que un agente escoge un algoritmo dentro de un conjunto aleatorio y genera un conjunto de algoritmos derivados de este para realizar una tarea, así hasta escoger el más adecuado. La evolución, señala el Stanley, puede arrojar resultados fortuitos que la optimización impulsada por objetivos no puede.

Estos diferentes métodos están haciendo el proceso de aprendizaje mucho más completo. La curiosidad y evolución podrían iniciar el proceso en ambientes más amplios y con poca información, para después ser remplazados por el aprendizaje asistido cuando algo resulte más interesante y así pueda asegurarse un aprendizaje más enfocado.

La curiosidad es una gran motivación para que los humanos aprendan. Quizá también lo sea para las máquinas.

Nexo con el tema que estudiamos: 

El desarrollo de la AI promete grandes cambios tal cual lo han hecho otras revoluciones industriales. Si bien aún se encuentra en desarrollo el proceso de aprendizaje de estas máquinas, ya cuentan con muchas funciones que permiten más desplazamiento de puestos de trabajo en cada vez más áreas. La forma en que se generan las ganancias y se realizan las mercancías pueden sufrir grandes cambios y con ello conflictos distintos.

Esto supone nuevas crisis en el empleo y calidad de vida de el espectro más grande de la población, con lo que las relaciones con el estado o empresas puede volverse más conflictivas. Pero, por otro lado, la AI también supone una ampliación de la presencia militar, profundizando el espionaje tanto dentro de las empresas, en las calles o incluso entre diferentes países.