Los gigantes de la tecnología contra el cerebro humano
Página principal Tecnología

La historia de cómo Google y Facebook compiten para crear una IA que venza a los humanos en todos los juegos.

Rémi Coulom pasó la última década creando un software que permitiera jugar al antiguo Go mejor que cualquier otra máquina en el mundo. Él llama a su creación Crazy Stone. A primeros del año pasado, en el clímax de un torneo en Tokio, desafió al gran maestro del Go Norimoto Yoda, uno de los mejores jugadores humanos del mundo, y lo hizo muy bien. En la llamada Electric Sage Battle, Crazy Stone ganó al gran maestro. Pero el triunfo venía con un aviso.

En los últimos 20 años, las máquinas han batido a los mejores jugadores humanos en tantos juegos de habilidad intelectual, que ahora asumimos que los ordenadores pueden superarnos prácticamente en todo. Pero Go – la versión oriental de ajedrez en la que dos jugadores compiten con piedras pulidas en un tablero de 19 x 19 intersecciones – es la excepción. Sí, Crazy Stone ganó a Yoda. Pero esto comenzó con una ventaja de cuatro piedras. Esa era la única manera de asegurar una contienda justa.

A mediados de los 90, un programa de ordenador llamado Chinook venció al mayor jugador del mundo a las damas. Años más tarde, el superordenador de IBM Deep Blue asombró al mundo del ajedrez cuando dio un buen repaso al campeón mundial Gary Kasparov. Y más recientemente, otra máquina de IBM, Watson ¡venció a los mejores humanos en Jeopardy!, el respetado trivial de la televisión. Las máquinas han ganado también al Othello, Scrabble, backgammon y póker. Pero viendo los pasos de la victoria de Crazy Stone sobre Yoda, Coulom auguró que tardaríamos otros diez años en ver que una máquina pueda ganar a un gran maestro sin ventaja previa.

En ese momento, esos diez años parecían bastante poco. Cuando juegan al Go, los grandes maestros a menudo confían en algo más cercano a la intuición que el análisis cuidadoso y razonado, y crear una máquina que duplique esta clase de intuición es enormemente difícil. Pero una nueva arma podría servir para que los ordenadores conquisten mucho antes a los humanos: deep learning (aprendizaje profundo). En compañías como Google y Facebook, el deep learning ha demostrado ser muy versado en el reconocimiento de imágenes y en la captación de modelos espaciales – una habilidad muy propia de Go.

Mientras exploran las muchas otras oportunidades que presenta esta tecnología, Google y Facebook también compiten en la carrera por superar el antiguo juego.

Como investigador de IA para Facebook, Yuandong Tian explica que Go es el clásico problema de IA – un problema que es inmensamente atractivo porque es inmensamente difícil. La compañía cree que mejorar Go no solo ayudará a refinar la IA que impulsa su popular red social, sino que también demostrará el valor de la inteligencia artificial. Rob Fergus, otro investigador de Facebook, coincide. «El objetivo es avanzar en la IA», afirma. Pero también reconoce que la compañía se ve impulsada, al menos en cierta medida, por su rivalidad amistosa con Google. Hay cierto orgullo en ser la que mejore el Go.

Crear una mente para Go

Hoy en día, Google y Facebook emplean deep learning para identificar las caras de las fotos que se publican en la red. Así es como los ordenadores reconocen las órdenes que se dan por un teléfono y como se traduce de un idioma a otro. A veces puede incluso entender el lenguaje natural – el lenguaje natural en el que los humanos conversamos.

Esta tecnología se apoya en lo que se han llamado las redes neuronales profundas (deep natural networks), enormes redes automáticas que se aproximan a la red de neuronas de la mente humana. Introduciendo las suficientes fotos de árboles en estas redes neuronales, pueden llegar a identificar un árbol. Si se introduce el suficiente diálogo, pueden llegar a mantener una conversación normal (aunque a veces rara). Y si se introducen suficientes movimientos de Go, pueden aprender a jugar a Go.

Las redes neuronales profundas son muy adecuadas para Go ya que este se impulsa por modelos de tablero. Estos métodos son muy buenos en la generalización a partir de modelos», afirma Amon Storkey, un profesor de la Universidad de Edimburgo que emplea redes neuronales profundas para abordar Go, muy parecidas a las de Google y Facebook.

Se cree que estas redes neuronales pueden finalmente cerrar la brecha entre las máquinas y los humanos. En el juego de Go se sabe que los grandes maestros no examinan necesariamente los resultados de cada movimiento posible. A menudo juegan basándose en el aspecto del tablero. Con deep learning, los investigadores pueden empezar a duplicar este enfoque. Al introducir imágenes de movimientos satisfactorios en las redes neuronales, se ayuda a las máquinas a aprender cómo es un movimiento positivo. Storkey comenta sobre las redes neuronales:

«En vez de intentar solo entender qué es lo mejor que se puede hacer, aprenden de los humanos a jugar al juego. Copian de forma eficaz el juego humano».

Más profundo que el Deep Learning

Crear una máquina que pueda ganar al Go no es solo una cuestión de potencia informática. Este es el motivo por el que programas como el de Coulom no lo han mejorado. Crazy Stone se apoya en lo que se llama una búsqueda de árbol Monte Carlo, un sistema que analiza de forma esencial los resultados de cada posible movimiento. Así es como las máquinas dominaron las damas, el ajedrez y otros juegos. Fueron más lejos que los humanos a los que vencían.

Pero con Go, no hay muchas posibilidades que considerar. En el ajedrez, en un turno en particular, la media de posibles movimientos es de 35. Con Go, es de 250. Y después de 250 posibles movimientos hay otros 250. Y así sucesivamente. Es imposible que un árbol de búsqueda considere los resultados de cada movimiento (al menos no en un tiempo razonable).

Pero deep learning puede cerrar la brecha proporcionando un nivel de intuición, en oposición a la fuerza bruta. El mes pasado, en un artículo publicado en la página Arxiv de investigación académica, Facebook mostró un método que combina la búsqueda de árbol Monte Carlo con deep learning. En competición con los humanos, el sistema se defendía bien, y según la compañía, incluso jugaba con un estilo que parecía humano. Después de todo, ha aprendido de los movimientos reales de los humanos. Coulom califica los resultados de la compañía como «muy espectaculares».

Al final, Coulom dice, este tipo de enfoque híbrido solucionará el problema:

«Lo que están intentando es combinar los dos enfoques para que se consiga uno que los supere por separado».

Destaca que Crazy Stone ya emplea un formato de aprendizaje automático sincronizado con Monte Carlo. Pero estos métodos no son tan complejos como las redes neuronales empleadas por Facebook.

El artículo de Facebook revela el poder del deep learning, pero también recuerda que las grandes tareas de la IA se resuelven al final con más de una sola tecnología. Se resuelven con muchas tecnologías. El deep learning hace muchas cosas bien, pero siempre puede obtener ayuda de otras formas de IA.

Ensayo y error

Después de que Facebook revelara su trabajo en Go, Google contraatacó rápidamente. Un alto investigador de IA de Google, Demis Hassabis, afirmó que, en pocos meses, la compañía revelaría «una gran sorpresa» relacionada con el Go. Google no quiso decir más sobre el tema, y no está claro lo que guarda la compañía. Coulom, por su parte, afirma que no es probable que Google pueda producir tan rápido algo que pueda superar a los grandes jugadores del Go, pero cree que la compañía dará un paso importante en ese campo.

Con toda probabilidad, esto también tendrá su apoyo en múltiples tecnologías. E imaginamos que una de ellas es algo llamado aprendizaje por refuerzo. Mientras que el deep learning tiene buena percepción – reconoce el aspecto, sonido o conducta de algo – los algoritmos de aprendizaje por refuerzo pueden enseñar a las máquinas a actuar sobre esta percepción.

Hassabis supervisa DeepMind, una filial de Google con sede en Cambridge, Inglaterra, que ya ha hecho buen uso del deep learning en combinación con algoritmos de aprendizaje por refuerzo. A principios de este año, su equipo publicó un artículo que describía cómo podían usarse estas dos tecnologías para jugar a los antiguos videojuegos Atari – y en algunos casos, superan a los game testers profesionales.

Cuando una red neuronal profunda ha ayudado al sistema a comprender el estado del juego – cómo está el tablero en un determinado momento – los algoritmos de aprendizaje por refuerzo usan el ensayo y error para ayudar al sistema a entender cómo debe responder a este estado de juego. Básicamente, el ordenador intenta un movimiento en particular. Después de intentar los suficientes movimientos, el sistema llega a entender las mejores formas de juego. Algo así puede funcionar con Go.

Este enfoque es diferente del árbol de búsqueda estándar, en el que el sistema aprende cómo identificar un buen movimiento. Los investigadores lo entrenan para jugar antes de que la partida verdadera comience. Igual que ocurre con el deep learning, este sistema juega a través de una especie de «conocimiento» en vez de aplicar la fuerza bruta al problema.

Al final, si mejoran el Go, las máquinas necesitan todas estas tecnologías. El aprendizaje por refuerzo puede alimentarse del deep learning, y ambos pueden entrelazarse con un enfoque tradicional como la búsqueda de árbol Monte Carlo.

Mejorar el Go sigue siendo enormemente difícil, pero la IA moderna se está acercando. Cuando Hassabis revele su «gran sorpresa» sabremos exactamente lo cerca que está.

Por favor, describa el error
Cerrar