Este premio se estableció en el 2007, el cual se le conocía como el Premio ACM- Fundación Infosys, en Ciencias de la Computación., el cual reconoce una temprana (o a la mitad de una carrera) a la contribución que, debido a su profundidad, impacte y tenga amplias implicaciones, ejemplificando los grandes logros en esta disciplina. El Premio que se otorga es de 250 mil dólares, el cual lo da Infosys Ltd.

¿Quién es David Silver?

El galardonado es profesor en el University London College y es el principal científico de investigación en DeepMind, una empresa de Google (2014), que trabaja en Inteligencia Artificial. Uno de los primeros resultados fue poner a una red neuronal a jugar los juegos de la consola Atari.

Mike James, co-autor con el propio Silver, dijo sobre este trabajo: «Lo novedoso de este trabajo es que no usa aprendizaje supervisado o no supervisado para entrenar la red de aprendizaje reforzado. La red se entrena usando una forma de aprendizaje Q el cual es probablemente el único enfoque válido en el aprendizaje reforzado para máquinas».

De la Atari a AlphaGo

El trabajo con los juegos de Atari y las redes neuronalesw evolucionó eventualmente en el desarrollo de AlphaGo, un algoritmo que combina ideas del aprendizaje profundo, aprendizaje reforzado, búsqueda tradicional en árboles y computación a gran escala. Este proghrama vencería a Lee Sedol en el 2016, uno de los mejores jugadores de Go, el juego de mesa oriental, que hay en el planeta. El documental al respecto puede verse más abajo. AlphaGo triunfaría en otras pruebas contra los mejores jugadores de la especialidad. El software finalmente se retiró de las competencias después de mostrarse prácticamente invencible.

Más allá de AlphaGo

Pero la idea de esta investigación va mucho más allá de ser el mejor jugador de Go en el mundo. Lo que se busca es usar este tipo de software, estos algoritmos, para lidiar y atacar problemas complejos: curas de enfermedades, reduciendo significativamente los recursos necesarios para estos desarrollos o bien, la creación de nuevos materiales, por ejemplo.

AlphaGo fue apenas un primer paso. Siguió el esfuerzo de DeepMind y crearon AlphaZero, que atacó el Shogi, el ajedrez  y Go, generando para ello algoritmos que han de hecho ya redefinido como los expertos en estos juegos lo entienden. Lo interesante fue entonces la creación de un algoritmo general para generar los métodos de juego que logren en un entrenamiento de redes neuronales, llegar a ser un jugador de altísimo nivel. AlphaGo y el equipo de Silver, ya han atacado con este mecanismo, problemas en las estructuras de las proteínas (AlphaFold DeepMind’s Protein Structure), por ejemplo.

Cherri M. Pancake, CEO de la ACM, ha comentado su premio de Silver: «Pocos investigadores han generado tanta emoción en el campo de la IA como David Silver».

Se planea que Silver reciba el galardón en el banquete anual del 20 de junio del 2020 en San Francisco, California, junto con otros ganadores de la ACM, si es que el covid-19 lo permite.