Activa las notificaciones para estar al tanto de lo más nuevo en tecnología.

Cómo AlphaZero ha reescrito lo que sabíamos del ajedrez y del Go

David Silver dice que este programa de computadora, quien aprende de sí mismo hasta llegar al nivel de súper gran maestro, exhibe la "esencia de la creatividad".

Silver trabaja para DeepMind, una empresa británica de Inteligencia Artificial, subsidiaria de Google. Él fue el líder de AlphaGo, un programa de computadora que aprendió a jugar al Go, un juego de mesa con más de 3000 años de antigüedad, en donde aprendió por sí mismo, las técnicas para jugar como un maestro solamente jugando millones de partidas contra el mismo programa y sacando conclusiones.

¿Cuánto costaría el Galaxy Fold en México?

La última creación de Silver es AlphaZero, que aprende a jugar el ajedrez chino: Shogi, el ajedrez tradicional y el Go, solamente practicando contra sí mismo. Después de millones de partidos de práctica, AlphaZero ha sido capaz de descubrir las estrategias que a los seres humanos les ha llevado siglos entender.

Silver habla de las posibilidades de que la IA pueda resolver problemas que nos superan a los seres humanos. Por ejemplo, en una famosa partida de Go contra posiblemente el mejor jugador del mundo, AlphaGo hizo un movimiento brillante, que los observadores pensaron que había sido un error. ¿Fue acaso la máquina creativa por esta vez?

El “movimiento 37” como se le conoce, sorprendió a todos, incluso a la comunidad de Go y a nosotros, dice Silver. Fue algo inesperado para los seres humanos que juegan Go y que han hallado estrategias que tienen miles de años de ser conocidas. “para mí, esto es un ejemplo de algo que está siendo creativo”, comenta Silver.

En el caso de AlphaZero, que es un programa mucho más general porque puede jugar Go, Ajedrez o Shogi, como no aprende de los humanos ¿deberíamos pensar que es incluso más creativo? Porque cuando uno aprende algo por sí mismo, y uno va construyendo su propio conocimiento desde cedro, es casi hablar de la esencia de la creatividad ¿o no?

En el caos de AlphaZero, el software tuvo que darse cuenta de todo por sí mismo. Cada paso dado es un brinco creativo, y esto es así, porque la máquina nunca recibió el consejo humano. Y estos brincos continuaron más allá de nuestras habilidades y tienen el potencial de asombrarnos a todos.

AlphaZero jugó una serie de partidas contra StockFish, uno de los programas de ajedrez más fuertes del mundo. ¿Qué se aprendió de esta experiencia? StockFish es un motor de ajedrez muy sofisticado, pro en el corazón del mismo está escrito de alguna manera que, “de acuerdo a los humanos, esta es una buena o mala posición”, por lo que estamos en un bucle infinito. Es bueno porque juega como nosotros pensamos que debe jugarse o hace jugadas porque le hemos dicho que son buenas.

AlphaZero aprendió a entender las posiciones por sí mismas. Y hay un juego hermoso en donde AlphaZero entrega 4 peones uno tras otro, e incluso, quiere entregar un quinto peón. StockFish piensa que está fantásticamente ganado pero AlphaZero está feliz. Encontró una manera de entender la posición que es impensable de acuerdo a las normas del ajedrez. Entiende que es mejor la posición que tiene que los cuatro peones de desventaja.

Pero más allá de sorprender al mundo del ajedrez, ¿cuál es la utilidad de AlphaZero en la innovación científica? El aprendizaje de máquinas ha sido el enfoque dominante, en particular una modalidad llamada aprendizaje supervisado, lo que significa que los programas aprenden lo que los srs humanos entienden y tratan de hacer lo mismo en el software. Pero también puede usarse el aprendizaje reforzado, que es como tener un millón de mini- descubrimientos, uno tras otro, que son los que construyen la esencia de la manera de pensar creativamente. Y esto es lo que buscamos, un poder inmenso, una habilidad inmensa para resolver problemas y que -esperamos- lleven a nuevos paradigmas y retos en la ciencia.

Con esta postura, ¿habrá aspectos de la creatividad humana que no pudiesen ser automatizados? Silver piensa que las capacidades de la mente humana, estamos muy lejos de lograr esto. Podemos resolver problemas en dominios muy específicos como pueden ser el Ajedrez o el Go, , al que le damos una cantidad masiva de poder de cómputo para así resolver una tarea. Pero la mente humana es capaz de generalizar algo diferente. Se pueden cambiar las reglas del juego y la máquina no necesitará de otros 2000 años para decir cómo debe jugarse.

“Yo diría”, afirma Silvers, “que estamos en la frontera de la IA en este momento, y que queremos ir a un lugar en donde podamos incrementar su rango y flexibilidad de nuestros algoritmos para cubrir una gama más amplia de lo que los seres humanos saben hacer. Pero hay un largo camino para ello”.

¿Y cómo llegar a ello? Silver dice que le gusta esto de preservar esta idea de que el sistema sea libre para crear, sin tener que estar limitado por el conocimiento humano. “Un bebé no está preocupado por una carrera universitaria, por tener hijos o por trabajar. Juega con sus juguetes y aprende habilidades para manipular cosas. Hay mucho que aprender del mundo en la ausencia de una meta final. Lo mismo pensamos que debería ser cierto para nuestros sistemas”.

Comentarios