La nueva inteligencia artificial de Google se enseñó a sí misma a jugar al ajedrez y venció al mejor programa del mundo

8

El programa AlphaGo Zero

Le llevó penas unas horas. Una versión anterior del software ya había impuesto al campeón mundial del milenario juego asiático go.

En el centro, Lee Se-Dol, legendario campeón mundial de go, junto al director de Deepmind, Demis Hassabis, a la izquierda, y Eric Schmidt, el director ejecutivo del dueño de Google, Alphabet. Fue durante la conferencia de prensa del desafío desarrollado en Seúl en marzo de 2016. (AFP)

de Tecnologia

los videos más vistos

comentarios

Google aseguró hoy que su programa de inteligencia artificial AlphaGo Zero se impuso al software líder mundial de ajedrez con solo horas de auto enseñarse el juego desde cero.

La división DeepMind (Mente profunda) de Google dijo que su programa se enfrentó contra Stockfish 8 en 100 partidas y ganó o empató todas. Los datos tienen que ser aún confirmados por veedores externos.

De todos modos, los expertos sostienen que el logro reforzará la posición de la empresa en un sector sumamente competitivo.

“Desde un punto de vista científico, es el último de una serie de deslumbrantes resultados producidos por DeepMind”, sostuvo Michael Wooldridge, profesor de la Universidad de Oxford a la BBC.

“La trayectoria general que sigue DeepMind es primero resolver un problema y luego demostrar que realmente puede ir perfeccionando su rendimiento, y eso es muy impresionante”, agregó.

El surcoreano Lee Sedol, campeón mundial de go, fue derrotado en el reto máquina-humano en marzo de 2016. (AP)

Ya este año, la revista Nature publicó que esta nueva versión de AlphaGo (la AlphaGo Zero) fue capaz de aprender a usar el clásico juego de estrategia Go sin intervención humana. Lo increíble fue que esa versión le ganó a la anterior, que había sido entrenada por humanos.

El nuevo algoritmo AlphaGo Zero derrotó por 100 partidas a cero a su propio predecesor, que había logrado el reconocimiento mundial al ganar en marzo de 2016 al surcoreano Lee Sedol, campeón del mundo de Go en 18 ocasiones.

El AlphaGo original fue entrenado a partir de un aprendizaje supervisado, a partir de millones de movimientos de partidas disputadas por jugadores humanos expertos, y se sometió después a un proceso de refuerzo con juegos contra sí mismo.

El reto de los ingenieros en la nueva versión del algoritmo era lograr que aprendiera el juego partiendo de una “tabula rasa” y sin ningún conocimiento de partidas humanas previas.

AlphaGo Zero adquirió su maestría en el juego de estrategia únicamente disputando partidas contra sí mismo. Empezó a jugar con movimientos de fichas al azar y fue aprendiendo en cada partida en base a los errores y aciertos cometidos.

El algoritmo funciona en una única computadora dotada con cuatro Unidades de Procesamiento de Tensor (TPU, en inglés), circuitos integrados desarrollados específicamente para el aprendizaje de máquinas.

Transmisión televisiva del reto máquina-humano en el que AlphaGo se impuso al surcoreano Lee Sedol, campeón mundial, en marzo de 2016. (AP)

En tan solo unos días de auto aprendizaje, en los que el sistema jugó cerca de cinco millones de partidas contra sí mismo, AlphaGo Zero ya era capaz de superar a cualquier humano y derrotar a todas las versiones anteriores de AlphaGo.

Los autores del trabajo, ingenieros de la compañía británica DeepMind -adquirida por Google en 2014-, subrayan que su programa de inteligencia artificial ha descubierto de forma independiente algunos conceptos del juego del Go que los humanos tardaron siglos en conceptualizar.

AlphaGo Zero también ha desarrollado nuevas estrategias que no habían sido antes puestas en práctica y que arrojan nueva luz sobre las posibilidades del juego, inventado en China hace más de 2.500 años.

Fuente: EFE y BBC

te puede interesar

Para comentar, activá tu cuenta desde el mail que enviamos a tu casilla de correo.

Registro Propiedad Intelectual: 5344702. Propietario Arte Gráfico Editorial Argentino S.A. © 1996-2017 Clarín.com – Clarín Digital – Todos los derechos reservados.

*